基于HTK的汉语连续数字语音识别研究

被引量 : 0次 | 上传用户:ZFsky260583
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与信息技术的继续发展,语音交互技术必将成为人机交互的必要手段。语音识别技术就是让机器听懂人类的语音并执行相关的动作,是一个研究的热点。连续数字语音识别是语音识别的一个重要分支,它在现实中具有广泛的应用前景,在互联网,通信,军事,国防,人机交互等方面都有重要的应用价值。虽然这方面的研究有很多,但目前仍有许多问题有待进一步探索。本文主要研究的是基于HTK的汉语连续数字的识别以及相关研究,首先对HTK(Hidden Markov Model Toolkit)的软件结构以及HTK工具包进行了分析,搭建出基于HTK的汉语连续数字语音识别系统,测试了声学模型,高斯混合分量和MFCC维数对系统识别率的影响。接着,在理解了基于HTK的语音识别系统的搭建过程的基础上,实现了基于HTK的语音拨号系统,是对电话号码和人名的语音识别。然后,进行了基于ATK(API of HTK)的实时语音识别的初步研究。讨论了使用ATK建立一套实时语音识别系统的过程,并且实现了基于ATK的实时语音拨号系统,但是识别效果不理想。对较为复杂的语音识别网络,开展了HTK中语音识别网络的研究,导出了一种优化语音识别网络的方法,并且从理论上证明和实验上验证了其正确性。最后,针对语音识别和因特网传输技术的特点,设计出简单的语音识别网络传输方案:采用客户/服务器模式,在客户端提取出语音信号的特征参数,采用TCP协议把特征参数传输给服务器,由服务器完成识别与训练的工作。系统使用HTK和Visual C++编程工具,使用MFC中封装的Windows Sockets类完成了语音特征参数和识别结果的网络传输,实现了一个初步的基于网络传输的连续数字语音识别系统。
其他文献
金庸的武侠小说作品拥有数亿计的读者,受到国内外读者的喜爱。武侠小说创作中,金庸汲取东、西方现代文学的新技法,为中国文学的民族化与现代化创造了成功的经验,创造性地塑造
在经济全球化和区域经济一体化的背景下,城市群成为主导世界经济发展的主要动力。近几年,随着中部崛起战略的实施,中部六省不约而同地选择了城市群作为实现各自崛起进程的首
项目管理对企业在运营效率方面起到重要的作用。项目管理的概念存在于企业运营中每一个环节,通过项目管理的理念和方法的运用,企业在运营方面会大大提高效率。项目管理的目的
一直以来阅读作为人类社会认知所必需的活动和掌握语言知识获取信息的基本方式,在学习外语四项基本技能中处于中心地位。不仅因为它能促进听力输入过程而且可以帮助提高说和
给青年和社会提供有效的服务是共青团组织在市场经济条件下的新的核心竞争力。随着改革的逐步深入,社会转型带来的经济形式和生活方式的多样化,青年群体的流动性增大,游离在
一个企业能否创造并保持核心竞争力,事关其生存和发展。企业核心竞争力是一个系统的概念,它是企业长期经营过程中所积累的知识、技术、文化、机制和能力等等的有机集合体。企
本文主要考察了汉语指示代词和韩国语指示代词的语篇功能。语言的指示系统为“二分”和“三分”。“二分”和“三分”系统都有“近指”和“远指”的对立,“三分”系统里除此
在通常情况下,中国古代的母亲承担了对儿子的生殖职能并在一定程度上分担了对于儿子的道德和人格培养职能。正是这种职能使母子关系联为一体,母亲与儿子形成精神或物质层面的
村落儿童健身游戏是劳动人民在生产、生活中经过不断加工集体创造并广为流传的具有鲜明的地方特色和生活气息的活动,不但符合儿童好学、好动、好模仿、好游戏的心理特点,而且
近十多年来,“个性化教学”越来越成为我国基础教育改革研究的热点。教师是个性化教育改革的关键。在中职语文教学活动中,我们却很少看到真正意义上的个性化教学,特别是从教