基于隐马尔可夫模型的语音识别方法的研究

被引量 : 0次 | 上传用户:fmylqy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别不仅是指机器通过学习实现从语音信号到文字符号的理解过程,作为一门交叉学科,与声学、语言学、人工智能、数字信号处理、模式识别等学科有着紧密地联系。 大约经过50年的发展,语音识别技术已经能够实现大词汇量、非特定人的连续语音识别系统,汉语语音识别技术目前已经发展到世界先进水平。针对汉语发音的特点,本文以离散隐马尔可夫模型为方法,对中等词汇量、非特定人、孤立字的汉语语音识别进行了基础研究。 首先,文章在对语音信号进行分析的基础上,对短视平均过零率的算法进行了改进,又利用幅度和短时平均过零率两个参数改进了端点检测的方法。然后对汉语发音的特点进行了研究,分析了以音素为单位的声母和韵母的特点,提出了查找过渡点将声母韵母分离的方法。 接下来本文对语音识别系统的两个重要部分——特征参数提取和矢量量化的相关知识给予了介绍。 最后,本文着重对以DHMM为方法的语音识别系统进行了分析,讨论了在语音识别系统中DHMM参数选取的问题。对于非特定人、中等词汇表、孤立字的语音识别系统,使用了DTW和DHMM两种方法进行了试验比较,验证了DHMM方法的优越。还对特征参数的选取对识别率的影响进行了讨论,得出了加权差分倒谱系数是一个优越参数的结论。通过矢量量化参数选取的讨论,得到对于中等词汇量的语言识别,矢量量化的码本大小应为64或128的结论。并且,在对汉语发音研究的基础上,对DHMM的不足进行了改进,提出了两段式DHMM语音识别的方法。试验结果表明,此方法能够降低系统的识别时间,还能提高系统识别率。
其他文献
本文研究和探讨了MVC 模式在国电物资商务网采购系统中的应用,重点介绍了MVC 架构基于直接采购这一业务模型的具体实现。在此期间通过大量的MVC、J2EE、Struts 等相关技术资
岗位评价是薪酬制度设计的基础工作,因素计点法是岗位评价中最为常用的方法。但在企业实践中,这种方法的科学性、可靠性经常受到使用者的忽视。本文讨论了该方法在设计使用过
服务是我们企业发展过程中的重要组成部分。在营销过程中,一定要抛弃那种只注重营销,不注重服务的市场扩张模式,而忽视实际、不讲究策略的盲目营销行为,否则必然影响公司的长
受后现代主义思潮解构思想的影响,后现代女权主义站在更高的角度上批判了以前的三大女权主义流派;批判已有的社会主体、历史、真理等理性的产物,指出女性地位的人为性和可争
基于外商直接投资的期权特性,本文运用实物期权理论就汇率对外商直接投资之间的关系进行建模,理论上证明人民币汇率水平、汇率预期和汇率波动对中国吸收外商直接投资存在的影
近年来,随着网络技术的迅猛发展,利用XML(eXtensible MarkupLanguage)进行交换、传输的数据日益增多,“它的广泛应用为信息检索提出了新问题,同时也带来了新机遇”。在此情况
普通高中语文课程标准对高中语文教师提出了新的要求,语文教师要适应这一要求,必须在思想观念的更新、知识结构的优化、教学方法的改进和评价体系的创新等几个主要方面下工夫
目的:探讨糖皮质激素应用于渗出型结核性腹膜炎(tuberculous peritonitis,TBP)的适应证和方法以期达到最佳疗效.方法:以同期30例渗出型TBP为研究对象,抗结核治疗2 wk后加用糖
普通商用飞机、直升机、巡航导弹等空中动目标的定位与跟踪是无线电领域的一个重要研究方向。由于“电子战”的发展及雷达在现代战争中的地位和作用日益突出,面临“四大威胁
方弘静是活跃于明代嘉靖、万历年间的徽州知名诗人,他在诗歌创作、诗学理论等多个领域取得了较大的成就,并以集士大夫、地域性诗社领袖于一体的特殊身份,对这一时期徽州文学