带噪环境下的汉语连续语音识别研究

被引量 : 0次 | 上传用户:leisiyue520zh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,汉语连续语音识别在纯净语音环境下,已经取得了较好的识别效果。但在自然环境下,由于各种噪声的影响,识别率依然很低,还不能满足实际场合的应用要求。因此带噪环境的连续语音识别一直是当前语音信号研究的热点和难点。HMM模型是连续语音识别中应用最广泛的模型之一,但模型的训练往往是在安静的实验室环境下完成的,因此训练模型无法有效描述自然环境下实际语音信号的特点。噪音干扰使端点检测的准确性也大为降低,系统识别率也随之下降。除此之外,汉语连续语音识别中识别基元的选取,模型的上下文相关,都对识别率有较大的影响。为了提高带噪环境下语音识别系统的性能,本文根据连续语音识别的基本原理,针对带噪环境的特点,对语音识别算法进行了一些研究,具体工作如下:(1)研究了一种改进的基于谱减的语音增强算法,该算法解决了基本谱减法的“音乐噪声“问题;采用基于自适应子带谱熵的端点检测算法,并将它与改进的谱减语音增强相结合,进一步提高了带噪环境下语音端点检测的准确率。(2)介绍了一些常用语音特征的提取算法如反映人类声道信息的LPCC,具有抗噪性能的MFCC;提出了一种基于线性预测与归一化互相关的基音特征提取算法,该算法提高了带噪环境基音检测的性能。(3)讨论了HMM模型的基本原理,并对HMM的三个基本问题前--后向算法,Viterbi算法,Baum-Weich算法做了详细介绍;同时对HMM应用中的HMM初始模型选取、溢出问题以及模型的合并也做了深入的探究。(4)针对汉语连续语音识别系统中声学模型的训练,发音协同等问题,对声学模型中识别基元选取、声学模型的嵌入式训练以及上下文相关的三音素模型等做了进一步的研究;最后,采用HTK工具箱进行了一系列的实验分析。
其他文献
本文通过对对外汉语教学中文化教学内容以及文化教学在对外汉语教学中的作用分析,论述了文化教学和语言教学的关系、文化教学在对外汉语教学中的地位,提出了一些文化教学的方
原型是神话精神的文化传承,是表达民族文化心理的重要符号,是有着本原性阐释功能的民族文化模式。在文学创作方面,原型在根本上制约着创作想象的范围、方式和深度。本文着重
城市空间的演变与社会变革有着密切关系,清末以后,剧烈的社会变革导致了近代中国城市空间的重组,广州作为岭南重要都会城市,自然亦是如此。民国肇始,民主、平等观念逐渐在广
水意象在中国传统文学中占有重要位置,被认定为中国古典诗词中使用最为频繁的意象之一。对中国古典诗词中水意象的传统研究主要是从美学和文化等方面入手。认知语言学的发展
党的十六届四中全会提出了加强党的执政能力建设的历史任务,党的十七届四中全会进一步强调,党的执政能力建设关系党的建设和中国特色社会主义事业的全局。在我国,区县处于城
晚唐诗人李商隐的《登乐游原》一诗久负盛名。诗歌最后两句,千古传唱,一直以来对其的解读也是众说纷纭。小学古诗词教学中应引导学生对诗句的表达意向进行解读,从而帮助学生
移动互联网的迅猛发展极大地改变了人们的媒介使用习惯,社交媒体日益成为人们获取信息的重要来源,这些变革都对传统新闻媒体产业产生了巨大冲击,形成深远的影响。社交媒体正
图像处理技术在现代社会发展中具有重要的作用,随着现代科学技术水平的不断提升,图像处理技术也获得了较大的进步。基于FPGA的图像处理技术具有开发成本低、灵活性强以及维护
主观幸福感是由人们所拥有的客观条件及其需求价值等因素共同作用而产生的个体对自身存在与发展状况的一种积极的心理体验。主观幸福感作为反映个体或群体生活质量和心理健康
本文结合笔者自己的教学实践,阐述了实验是学生学习自然科学的基本方法,学生应该充分利用一切机会亲自动手操作,来逐步提高自己的学习兴趣和效果。