经验模态分解及深度信念网络在语音识别中的应用研究

被引量 : 0次 | 上传用户:yun568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能化应用和互联网技术的快速发展,语音识别作为一种便捷有效的人机交互方式,其重要性显得愈发突出。但由于语音发声环境的复杂多变和人类语言的巨大口音差异,语音识别的准确率面临较大的困难,难以使相应的语音产品达到用户预期的体验效果。若要使语音识别技术取得突破,必须在语音识别的基础理论上进行不断的完善和创新。由于语音信号是典型的非线性和非平稳信号,而传统的语音处理方法如傅立叶变换,小波变换等都是假设信号为短时平稳,故得到的诸多结论也势必破坏有用信息的分析和提取。本文以此为背景,在阐述了语音识别基础知识的前提下,着重研究了不同信噪比环境下的语音端点检测算法和基于深度信念网络的孤立词语音识别系统。本文的主要研究内容和创新成果如下:(1)在深入探讨了传统语音处理方法的局限性基础上,本文着重研究了经验模态分解这一新型信号处理方法,并对其适用于非线性非平稳信号的特点进行了算法验证。(2)针对传统语音端点检测算法存在对含噪语音信号检测准确率不高的问题,本文提出了一种基于经验模态分解和复合能量的语音端点检测新算法。该算法首先利用经验模态分解将语音信号分解成一组固有模态函数和一个剩余量,并滤除含有较多噪声的低阶固有模态函数,将剩余的固有模态函数重构成语音信号。然后利用Teager能量对噪声幅度的压缩作用,计算每帧重构语音信号的Teager能量,与短时能量加权,得到每帧信号的复合能量。最后将每帧信号的复合能量与自适应阈值进行比较,得到信号的起止点。通过仿真实验验证了算法的有效性,与传统的基于短时能量和短时过零率的双门限法相比,该算法体现了在低信噪比环境下的优越性。(3)针对传统神经网络在语音识别中存在训练速度慢,易陷入局部极小值的缺点,本文设计一种基于深度信念网络的孤立词语音识别系统。该系统首先对限制玻尔兹曼机模型(RBM)进行单独训练,并将第一个训练好的RBM模型的输出作为第二个RBM模型的输入,继而单独训练,直至训练完最高层的RBM。然后将所有训练好的RBM堆叠成深度信念网络,并利用反向传播算法对其进行优化,得到训练好的深度信念网络识别模型。最后将提取好的语音Mel倒谱特征参数输入到深度信念网络中进行孤立词的语音识别。通过仿真实验,与改进的BP神经网络相比,该算法取得了更高的识别率。
其他文献
本文从LTE对承载网的需求出发,对IPRAN的网络架构、承载需求、组网建设方案等问题进行了分析和阐述,给运营商在规划IP RAN网络时提供建议。
为了提高空间数据库的查询效率,本文提出一种新的索引方法—TG索引,给出相应的法则并加以详细的解释,这种新的索引方法在对地质勘探图件处理中得到实际应用,效果理想。
本文主要是探讨了建筑的地下室顶板作为建筑上部结构嵌固端的条件及技术措施,还有嵌固端的正确选取是建筑结构结算模型中的一个重要假定,对结构计算结果的真实性和准确性有很
本文是从古代先民们的祭祀礼仪的表现,周代、汉代以及唐代至明清帝王们对宫廷祭祀礼仪的表现,东北满族、西南地区的景颇族、彝族、普米族、傈僳族的祭祀礼仪表现,来揭示他们
我国新医改给卫生经济学教学带来了挑战。传统的单一教学模式存在很多的问题。文章介绍了教学手段探索,如利用案例教学启发思考、充分运用多媒体教学手段、角色扮演、课堂互
本文通过分析南充市部分高中学生现阶段的生活方式,探索生活方式对身体健康造成的影响,以及促使其养成这种生活方式的原因,为制定科学合理的生活方式行为习惯,提高高中生体质
<正>自古以来,文人与酒便结下了难解之缘,不知有多少文人墨客拜倒在酒杯之下,留下诸多轶闻趣事。晋代"竹林七贤"之一的刘伶以其善饮、豪饮而闻名于世。其酒量之大,举世无双,
期刊
<正> 北美独立战争是世界近代史上的一个伟大历史事件,是一场正义的、以弱胜强的资产阶级民族解放战争。它又以善于运用外交策略受到了列宁的高度评价。利用欧洲列强之间的矛
本文通过对近五年8份全国课标试卷的实验题进行研究,分析其特点,从中提出高考实验复习应该回归本源,结合全国新课标卷实验题特点,谈四点实验教学启示:回归基本器材——实验复
为同时保证纯电动汽车的动力性和经济性,提出了一套由驱动电机和控制器组成的、满足驱动电机系统特性的纯电动汽车动力总成匹配设计流程和设计方法。使用数值计算工具,对驱动