基于拼音音元的语音识别系统研究与设计

被引量 : 0次 | 上传用户:Pinger605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步,人们对智能化的追求日益强烈。语音识别是人类与机器沟通的一个桥梁,越发受人们的关注。人们想要与机器自然随意的交流,就要求机器能够对大词量的连续语句准确理解,能够抵抗口语化、噪音等干扰因素的影响。然而大词量的连续语音识别在现阶段还遇到了很多的困难,大词量的连续语音识别系统识别效率还不能令人很满意。而且在全球化的进程中,多种语言的混合使得语音识别更加困难,如在一句话中夹杂有英语和汉语,对于这种情况,现在的语音识别系统都将无法应对。为了解决大词量和语音连续性的难题,本文对基于拼音音元的语音识别系统进行研究,在声韵母语音识别系统的基础上进一步对识别单元进行细化,使用已有的一些成熟的语音识别技术,结合本文提出的语音音元分割方法和语音语义识别分离的架构形成一种全新的语音识别系统框架,并在matlab环境下进行了初步的实验研究。本文的主要内容包含如下三个部分。1)对基于拼音音元的语音识别系统相关的语音技术进行讨论,对语音识别中用到的语音模型原理、汉语拼音相关知识、语音信号预处理技术、语音特征参数提取技术、模版匹配等技术都进行了详细介绍;并对特征参数LPCC与MFCC做了比对,分析了MFCC的优势。2)建立基于拼音音元的语音识别系统,并详细介绍了系统中各部分技术的具体求解方式。包括双门限法查找语音端点、FE算法分割声韵母、语音音元分割方法、MFCC系数作为声韵母的特征系数、DTW算法实现特征模版匹配、字库的建立与查找等技术的实现。重点对多种语音音元分割方法进行了分析和对比,本文提出的基于语音包络的语音音元分割方法和基于极值的语音音元分割方法具有较好的效果,其中基于极值的语音音元分割方法兼具有低计算量和高分割率的特点作为基于拼音音元的语音识别系统中的基音分割技术。基于拼音音元的语音识别系统将声韵母采用了不同的特征模版库,并对韵母部分进行了更细致的分割,使用其基元用于特征提取,减少了特征模版的长度。此外本系统在模版匹配后得到的是声韵母的字母序,此时实现的是语音的识别;再根据字母序,使用智能拼音的方式将字母序转换为具体的文字序,实现语义识别。语音与语义的分离能够减少匹配难度和搜索量,还有利于多种语言的混合识别,也有利于与其他更成熟的系统,如智能拼音系统,进行合作,实现更加智能的效果。3)在Matlab上对多种音元分割方法做实验对比,并在多种噪音情形下做对比处理,基于极值的音元分割方法具有较好的分割性能。音元分割对这个基于音元的语音识别系统非常重要,影响到韵母模版特征的提取,并会影响到最后的语音识别结果。基于极值的音元分割方法对于音元分割准确率可以高达90.2%,在与比较高效的汉语拼音输入法的联合应用中将可以对其中的部分错识的拼音进行一定的更正,语音识别系统整体识别率将更高。本文通过对基于拼音音元的语音识别系统的研究和部分关键技术的实验分析,为语音识别建立了一种语音识别与语义转换分离的架构,为大词量的语音连续语音实时识别技术提供了一种新的解决思路。
其他文献
现代汉语副词“也”作为一个常用副词,有许多意义和用法,在汉语教学中,我们常常能够遇到留学生关于“也”使用的偏误。本文通过个案跟踪、中介语语料分析、问卷调查等研究方
三氧化钨(WO3)是一种典型的N型半导体功能材料,也是常见的过渡金属氧化物之一。在过去的几十年里,WO3在气敏传感、电致变色、化学催化以及电化学等方面表现出的优异性能使其越来
随着我国经济建设的稳步推进,居民生活水平逐步攀升,在解决温饱问题等低层次的生理需求以后,就出现更加多样化的需求,对于身体健康的追求就是其中的一种。当我国成为名符其实的“
<正>力量是运动的基础,但力量素质必须很好地转移、发挥、利用,以便有效地提高专项成绩,所以专项力量素质显得尤为重要,是运动员完善专项技术、提高专项运动成绩的决定因素。
大学生兼职已经成为一种普遍的社会现象,同时也带来了一系列的社会问题。各地大学生兼职纠纷事件比比皆是,维权之路却修远。主要原因是用人单位缺乏社会责任,法制不健全,政府
日本《土壤污染对策法》对土壤污染的修复整治作了详细的规定,从而对日本的土壤污染防治工作起到了巨大的作用。目前我国土壤污染防治方面的法律制度还不健全,加之土壤污染形
环境是影响幼儿语言发展的重要因素,在幼儿园教育范围内主要有物质环境和非物质环境两种。本文认为,要积极利用家庭资源,家园共同促进幼儿语言的发展。
汉字教学是整个对外汉语教学的重要部分,我国对外汉字教学虽然探索出了一些教学方法,但与我国小学识字教育相比,总结出的经验和成果相对较少。本文对小学识字教学方法进行简
我们的日常生活中充斥着各种各样的非真实性话语。很少有人从社会语言学的视角来研究非真实性话语,大多数从社会语言学的角度对男女性别语言差异的研究都是以真实性话语为语
论文拟以知识者叙事为经,以共和国前三十年历史为纬,展现20世纪五十至七十年代中国小说中所折射的知识者的心路历程与言说形式的变迁。“知识者叙事”一词,大致涵括了知识者