基于HMM模型的语音情感识别的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:yy4733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互系统的快速发展,语音情感识别近年来越来越受到人们的重视。包含在语音信号中的情感情息是一种很重要的信息资源,它是人们感知事物的必不可少的部分信息。例如同样的一句话,由于说话人表现的情感不同,在听者的感知上就可能会有较大的差别。所谓“听话听音”就是这个道理。本文首先介绍了语音情感识别的发展历程、研究背景、研究领域及其主要应用,接下来介绍了目前语音情感识别主要研究方法及本文在语音情感识别中所用的情感的分类及其韵律特征。重点分析了各种特征参数的提取方法(不仅包括韵律特征参数还有非韵律特征参数如共振峰)。其中基音检测算法采用一种自动调整窗口长度的算法,能够根据不同的人、不同的发音的差异来调节窗的长度,提高基频提取的准确性。本论文应用隐马尔可夫模型(HMM)的进行语音情感识别,对其分析过程和设计思想进行了深入详细地探讨。本文使用的汉语语音库包含了高兴、愤怒、悲伤、惊讶、恐惧和平静语音,提取了语音库中情感语句的短时能量及其一阶、二阶差分,基频及其一阶、二阶差分,第一共振峰和MFCC共八维情感特征参数。使用从左向右的连续隐马尔可夫模型(CHMM)进行情感语音识别,每个CHMM模型用六个状态,每个状态用四个混合高斯概率密度函数来估计输出概率密度函数,并应用Baum-Welch参数重估算法来训练CHMM模型参数。为了使训练结果更好地收敛为全局的最优,我们用“分段K均值算法”重估HMM模型的观察值概率距阵。最后应用Viterbi算法对该语音库情感语句进行识别,实验结果表明,六种情感的总体识别效果较为理想,其中悲伤和愤怒的识别率更好一些。最后讨论了该领域存在的一些问题和今后需要进一步研究的课题。
其他文献
从视频序列中将人的各种行为进行有效地分类与识别,是智能视频监控、虚拟现实、人机交互等领域的基础研究任务。随着研究的不断深入,人体行为分析与识别已成为计算机视觉中的
本文首先全面介绍了第三代短波自动链路建立系统,并对其自动链路建立(ALE)协议和业务管理(TM)协议的工作机制作了简要描述。重点讨论了数据传输协议体系的设计和实现。数据传
本文根据保定市及各县供电公司自动化信息管理现状,提出了基于J2EE平台的Web系统开发。采用MVC模式和Struts框架,将系统分为视图层、控制层、模型层三个层次,并逐层实现,完成
随着多媒体服务与应用中对更高数据传输速率需求的不断增加,下一代移动通信网络预期需要提供更高的比特传输速率。日益明显的趋势让运营商寻找新的方式提升网络覆盖与网络容量
中断连续波雷达在未来的高技术战争条件下,具有广阔的应用前景,它以其固有的优点,近年来倍受世界各国的青睐,成为雷达技术研究领域的热点。国内对于伪随机码调相中断连续波雷达的
电力线用来作为通信媒介已成为现实,只要铺设电力线的地方,就可以进行高速数据传输。用电力线上网是通信技术发展的趋势,也是通信技术多样化,现代化的要求。本文介绍了宽带电
误码仪是在通信系统的性能测试以及故障诊断中必不可少的设备。传统的误码仪基于CPLD和CPU协同工作,结构复杂,价格昂贵,而且不方便携带,随着现代EDA设计技术的进步,越来越多
计算机网上阅卷作为近年来我国考试领域的重大改革,受到社会的广泛关注,但也存在一些问题尚需解决。目前,评卷管理都采用基于密码管理的模式,但当个人密钥丢失后存在身份无法认证
近年来,随着物联网的快速发展,RFID技术被广泛应用在零售业、物流业、制造业、医疗行业和信息产业等领域中。为了满足RFID技术的实际应用需求,必须要搭建一套高性能的RFID实
为了迎接WiMAX等移动宽带无线接入技术市场的挑战,2004年3GPP启动了UMTS标准的长期演进版本-LTE。2008年3GPP开始了面向LTE的平滑演进LTE-A技术的研究。LTE-A引入了多个关键技