基于机器学习的婴儿语音检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Mijieer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,哭声是婴儿与外界交流主要途径,婴儿通过哭声向外界传达需求,婴儿照料者则需根据婴儿的哭声来满足其需求。现阶段对婴儿哭声的研究大多集中在婴儿哭声的分类,检测婴儿哭的原因,比如,饥饿、瞌睡、不舒服等。但上述研究成果的应用需要建立在能够准确检测婴儿哭声的基础上,而国内外相关研究很少,因此,本文研究了能适用于不同场景的婴儿哭声实时检测系统的核心组算法组成:婴儿哭声端点检测、语音增强和婴儿哭声检测算法,并将婴儿哭声端点检测和语音增强算法应用到婴儿哭声实时检测系统中。具体而言,本文的主要工作如下:第一,本文提出了一种基于模糊C均值(FCM,Fuzzy C-means)的婴儿哭声端点检测算法,该算法充分利用了婴儿哭声的特点,创新性的把FCM聚类算法应用到婴儿哭声端点检测这一场景中,解决了聚类算法因为需要预先设置聚类中心而不适用于语音端点检测这一问题。算法的仿真结果表明,本文提出的基于FCM的婴儿哭声端点检测算法在婴儿哭声检测这一场景中的准确度比2018年Xunbo提出的算法准确度高。第二,本文搭建了一个婴儿哭声语音数据库。现阶段婴儿哭声相关研究所使用的数据库大多是非公开的,为了满足课题研究需要,本文使用互联网手动采集的方式,从互联网采集婴儿哭声数据样本。并将经过预处理去除了不合格干扰样本后的数据集和来自Noise92噪声库的噪声合成具有不同信噪比的婴儿哭声样本。第三,本文改进了基于自相关的语音增强算法,仿真结果表明,改进后的明显较少了残留的音乐噪声。另外,本文介绍了四种常用的语音增强算法,并给出对应的仿真结果和算法优缺点分析。第四,本文提出了一种基于支持向量机(SVM,Support Vector Machine)的婴儿哭声检测算法,相比于现有基于深度学习的婴儿哭声检测算法,本文提出的算法更适用于中小数据集和对实时性要求较高的场景。本文针对婴儿哭声的特点,对输入音频信号提取了基因周期、频谱滚降点、子带频带方差、梅尔频率倒谱频谱系数、子带能量方差等特征。仿真结果表明,算法的准确度达到了94%,最后,本文搭建了一个婴儿哭声实时检测系统。本文将婴儿哭声端点检测算法、语音增强算法、婴儿哭声检测算法应用到了婴儿哭声实时检测系统中。具体而言,本文实现了一个婴儿哭声实时检测系统,该系统支持多婴儿,以及任意场景的实时哭声检测,并且配有相应的浏览器交互页面,供用户实时查看婴儿状态。
其他文献
不可否认小说教学是高中语文教学的重要组成部分,但是在小说教学中存在着教学模式“套版化”、教学目标不明确、小说教学边缘化等问题。小说教学的这种困境引起众多学者的反思,王荣生先生从教学实践角度提出了走出这一困境的途径——以小说合适的阅读方式为基础,重新审视小说的阅读价值和教学内容。本文就以小说阅读教学为研究对象,通过查阅文献、课例研究等方法,在分析小说阅读教学现状的基础上从小说阅读教学的教学内容、阅读
目的分析妊娠糖尿病患者加强护理干预的血糖控制效果及其对妊娠结局的影响。方法将我院2018年1月~2019年1月期间收治的98例妊娠糖尿病患者按照随机抽签法分为实验组(49例,常
本文目的是研究超声速雾化场粒径二维分布精细在线测量,给超燃冲压发动机的研究尤其是燃烧室结构研发以及燃料雾化性能的评估提供基础性的参考数据。实现高超声速飞行器最重
期刊
大数据时代背景下,信息数据增多、信息处理储存量变大,人们对计算机信息处理技术的要求不断提高,黑客恶意攻击、计算机病毒入侵等安全问题也相应增加,因此,技术人员在创新计
在我国,水果产业是农村经济支柱产业之一,在农业产业调整、出口创汇以及增加农民收入等方面有着十分重要的作用。果实的采摘、运输和果树的修剪等在果园的管理作业中是不可缺
全固态单频连续266 nm紫外激光器不仅具有固态激光器结构紧凑、线宽窄、可靠性较高等优点,而且具有激光波长短、分辨率高、光子能量集中等优点,因此在科学和工业应用领域中应
玻尔原子结构理论的建立及获得成功,离不开对物质实验方法的充分运用.在重视玻尔理论成功的同时,应看到玻尔理论的缺陷及其陨落对科学研究的指导性意义.从玻尔的失败中正确对
本文通过对唐代工笔人物画焕烂备致的发展面貌的概述,突出了唐代绘画在社会繁荣的过程中,获得了重大发展,迈向了古代绘画艺术的颠峰,此时期工笔人物画题材广泛,构图能力很强,反映出
目的探讨中药"行气活血酒精浸液"外用涂擦对四肢外伤骨折后肢体肿胀疼痛症状疗效。方法将2016年2月~2017年5月江西省万载县中医院骨伤2科入住的外伤致四肢骨折后肢体肿胀患者