【摘 要】
:
关键词检出是语音识别研究中的一个重要领域,其目的是从连续语音中检测出并确认给定的若干个特定关键词。跟关键词检出相比,目前连续语音识别有资源耗费大,速度慢,抗噪能力不
论文部分内容阅读
关键词检出是语音识别研究中的一个重要领域,其目的是从连续语音中检测出并确认给定的若干个特定关键词。跟关键词检出相比,目前连续语音识别有资源耗费大,速度慢,抗噪能力不强等缺点,这是连续语音识别短期内难以突破的问题所在。而关键词检出允许在嘈杂的环境中使用,因此在当前技术水平下,许多应用领域不适合连续语音识别,而要求关键词检出,这一课题的研究如能取得突破性进展,则将大大有助于拓宽语音识别系统的应用领域。由于本论文在关键词检出方面的研究刚刚起步,且非特定人大词汇量关键词检出系统需要建立词典,涉及到很多语言学知识,并且需要大型语料库,因此本论文主要研究了汉语小词汇量非特定人关键词检出算法,结合汉语语音的特点,提出了一种新的关键词检出算法:在语音信号预处理阶段,首先对信号进行小波变换,然后引入Teager能量算子,将连续语音信号切分成音节;选用Mel倒谱系数(MFCC)作为语音信号的特征参数;采用连续隐马尔可夫模型对关键词和非关键词建模;在搜索识别阶段,以词(双音节)为搜索单位,采用Viterbi算法进行词内解码,大大减少了搜索空间,提高了搜索效率,降低了算法复杂度;在关键词确认阶段,采用似然比检验的值作为置信度,实现了无语法限制的基于识别—确认两级结构的关键词检出。本文用Matlab 7.0软件作为编程和测试平台,用Adobe Audition1.5在实验室环境下录制语音信号,建立小型语料库进行离线训练和在线识别。实验结果表明,本论文提出的算法具有有效性及可行性,适用于汉语非特定人小词汇量关键词检出系统。
其他文献
目前我国有17所院校有舞蹈学专业硕士学位授予权,武汉体育学院是其中唯一一所体育院校。武汉体育学院2007年开始招收舞蹈学研究生,目前共两届学生,因而对体育院校舞蹈学研究
为了探讨草酸铂联合替加氟注射液治疗晚期大肠癌的疗效,对120例晚期大肠癌患者分别接受方案A(31例)、B(33例)、C(34例)和D(22例)治疗。方案A:替加氟(方克)800mg/m2,CIV(24h),
<正> 瓦罗是继加图之后的古罗马第二位农学家。如果说加图的农业著作反映了公元前三——二世纪罗马的农业经济,特别是中等奴隶制庄园的经济状况的话,那末,瓦罗的农业著作则比
孝道文献是指中国传统社会里所形成和繁盛起来的记录孝行、提倡孝道、颂扬孝德的文献,它是古代宗法社会的产物。唐代作为我国孝道文献发展的重要阶段,上承秦汉魏晋,下启宋元
当前,中国的新农村建设正如火如茶的进行,学术界的眼光也全面地关注到了新农村建设的各个层面,如何改善农村社会的传统治理模式,推进村民自治,从治理走向善治成为研究的焦点
<正> 十九、诗二首陶渊明诗文简介有疑陶渊明诗篇篇有酒。吾观其意不在酒,亦寄酒为迹者也。其文章不群,辞采精拔,跌宕昭彰,独超众类,抑扬爽朗,莫之与京。横素波而傍流,干青云
本文从风景园林规划的基本目的入手,通过实践和调研房山区中南部沟域景观资源,分析地区内各景观体系类型,分类整合地区景观资源特征,挖掘房山中南部景观资源本身价值,并通过
咪唑啉及其衍生物以其独特的分子结构,是近三十年发展起来的性能优异的缓蚀剂。在酸洗工业中对于碳钢、铜及铜合金、铝及铝合金等均具有优良的缓蚀性能;在采油、采气工业中能
2005年7月21日,我国对人民币汇率机制实行改革,到2008年的7月21日,是人民币汇率形成机制改革三周年纪念日。以人民币对美元汇率为例,2008年7月21日我国外汇交易中心当日的数