基于最优小波包分解的语音情感识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:hawkwang2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和对于人机交互技术要求的不断提高,新一代的人机交互对计算机情感智能的需求日益凸显。情感识别是情感智能的基础与必要前提,具有重要的理论研究意义和广阔的市场前景。作为一种高效的人机交互途径,语音信号蕴含着丰富的说话人情感信息,语音情感识别这项交叉学科研究课题正得到越来越广泛的关注与重视。近年来,小波包分析作为非稳态信号分析的有力工具,在数字语音信号处理领域得到了广泛关注。对于语音情感识别研究,发挥小波包分析的优点,提取能有效表征情感的语音特征,是本文的重点研究内容。  本文首先介绍了语音情感识别的研究背景与意义,对语音情感识别的研究现状作了概括性的描述,并分析了语音情感识别研究中的关键问题。  针对语音情感识别问题,本文定义了用于构建最优小波包基的Fisher比率准则函数,并实现了Fisher比率准则下最优小波包基的构建。在此基础上,本文提取了一种语音情感新特征——小波包倒谱系数。采用支持向量机作为语音情感分类器,本文通过大量的对比实验验证了小波包倒谱系数特征在语音情感识别中的有效性。其后,本文研究了小波包倒谱系数特征与传统声学特征的融合,实验结果表明多特征融合进一步提高了语音情感识别的正确率。  最后,针对语音情感识别中的噪声问题,本文引入了对加性白噪声具有较好鲁棒性的子带频谱质心参数,并通过适当的融合策略将其与小波包倒谱系数相结合,提出了一种小波包倒谱系数特征的噪声鲁棒性改进算法。不同信噪比水平下的语音情感识别实验结果表明,相比于原始的小波包倒谱系数特征以及梅尔频率倒谱系数特征,改进后的特征具有更好的噪声鲁棒性。
其他文献
温度控制系统在工业控制中得到广泛应用,适用于机械、冶金、电力、化工、纺织、食品、陶瓷等行业。而基于PCI总线的自适应温度控制系统由于其接口设计复杂,采集传输速率高而
随着网络技术、数据库、传感器、基因组学和蛋白质组学的发展,数据供给能力和数据分析能力间的矛盾日益突出,迫切需要一种能够对数据进行深层次加工的自动化技术,数据挖掘技术应
高光谱图像通常具有多模态类和模糊的类边界,空间自适应分类是遥感图像领域中具有挑战性的难题。由于高光谱图像包含多种感兴趣目标,而每种目标又包含变化的光谱信号,目标之间光
数据的爆炸式增长和网络技术的飞速发展引发了网络存储技术的出现。网络存储的两个主要分支是NAS(NetworkAttachedStorage,网络附加存储)和SAN(NetworkAreaStorage,存储区域网)
目标识别技术一直是具有重要意义和实际价值的研究课题,它在监控系统、医疗诊断和军事目标跟踪等领域得到了非常广泛的应用。但是由于目标本身的多样性和复杂性,以及实时成像
在不具备上网条件却要把本地计算机上的文件传送到远方的某台计算机上时,能否利用覆盖面更加广泛的GPRS网络将计算机和Internet网络连接起来呢? 中国移动的GPRS网络目前覆
近年来,随着我国在人造地球卫星、载人航天等两大领域取得的巨大成功,深空探测作为中国航天活动的第三大领域,其重要性和必要性越来越受到人们的重视。而在深空探测中,多普勒接收
随着科学的发展,出现越来越多的数学模型。这些数学模型来自于不同的学科并代表着不同的应用背景。与此同时,这些数学模型也激发了从事数学工作的研究者们。在实际应用中,有很多
Ad Hoc网络是一种自组织、自组态、无中心的可以立刻投入应用的无固定设施网络。正因为这些特点,Ad Hoc可以广泛的应用于军事领域、传感器网络、紧急和临时场合、个人网络等
交流异步电机是高阶、强耦合、非线性的多变量对象,矢量控制通过坐标变换将其等效为直流电机,实现了解耦控制,推动了交流电机的工业应用。但模型推导过程中的各种假设与忽略,以及实际运行过程中电动机参数变化、电机本身非线性特性,对实际运行过程带来的不良影响,使得常规控制方法的控制效果并不理想。本文将模糊控制思想分别和其它智能方法以及现代控制理论相结合,对交流调速系统的智能化控制及其优化进行了研究。 本