基于HMM和人工神经网络混合模型的汉语语音情感识别

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:seanchn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术的发展,语音的情感识别已经逐渐成为模式识别领域研究的热点之一。随着研究的不断深入,当单独使用HMM和人工神经网络来对语音情感状态进行分类识别时,效果并不是很理想。本文将HMM和人工神经网络两种算法进行融合,取长补短,形成新的混合模型,进而提高系统的识别率。该识别技术在服务机器人、语音自动应答系统等方面具有应用价值。本文对语音情感识别的发展现状进行了分析,对汉语语音情感识别的问题进行了深入的研究。首先,针对目前汉语语音情感识别在建立汉语语音情感数据库时存在很多困难的问题,对语音情感的基础理论以及建立汉语语音情感数据库的原则进行了详细的阐述。然后,为了减少语音信号本身对识别效果的影响,提出了基于GA-SVM的语音端点检测方法并对汉语语音的情感特征进行了统计分析,形成了一个30维的特征向量。针对目前单一的HMM和人工神经网络模型存在的缺陷,提出了将HMM和人工神经网络混合模型应用于汉语语音情感状态的分类识别。该模型首先由HMM产生情感语音信号的最佳状态序列,然后利用时间规整算法对同一状态的特征参数进行规整得到等维的特征向量,并将它作为人工神经网络的输入进行语音情感状态识别。该算法充分利用了HMM极强的动态时序建模能力以及人工神经网络强大的分类能力。最后,以Matlab2012a为工作平台进行编程仿真。实现了HMM和人工神经网络两种模型的结合。并将混合模型分别与HMM和人工神经网络模型进行对比。实验结果表明,HMM和人工神经网络混合模型提高了汉语语音情感识别系统的识别准确率。此外,混合模型在不同信噪比的条件下也体现出了它的优势。
其他文献
本文通过对荣华二采区10
期刊
肝脏、淋巴结窦内皮细胞C型凝集素(liver and lymph node sinusoidalendothelial cell C-type lectin,LSECtin)基因是从人胎肝cDNA文库中克隆的一种新型C型凝集素基因。作为C
我来中国的时候,一点都不觉得我是在边缘,反而觉得是来到了世界的中心,而且我相信以后也会如此.rn上世纪90年代,我写了一本书叫《后电视时代》.当时我预判电脑是我们的未来,
期刊
本文通过对荣华二采区10
期刊
马铃薯内含有18种人体所需的氨基酸和多种微量元素,具有全面、均衡、丰富的营养。不同马铃薯内部成分不同,对内部成分含量相似的马铃薯进行分级可有效的提高马铃薯的经济效益。但传统的检测方法存在效率低、工艺复杂、破坏试验样品等缺点,不能对马铃薯进行细致分级以增加马铃薯的经济效益。因此寻求一款快速、无损的检测方法具有重要意义。本文以马铃薯为研究对象,利用近红外高光谱成像技术(900-1700nm)结合化学计
随着电子信息产业的飞速发展,电路模块及器件的小型化,集成化及高频化成为衡量该行业发展水平的重要标准。低温共烧陶瓷LTCC技术完全迎合现代电子系统高频化、小型化的发展要求,目前它已成为电子元件集成封装的关键技术,而相应的材料研究对LTCC技术的发展起至关重要的作用。由于M型钡铁氧体具有较大的矫顽力和磁能积、单轴磁晶各向异性等优点,因而被广泛的应用在永磁、吸波和微波毫米波器件等领域中。本论文主要围绕M