基于SVM级联式语音情感识别模型

来源 :广东工业大学 | 被引量 : 0次 | 上传用户：passionzy

【摘要】

：

随着人工交互技术的飞速发展，越来越多研究者关注情感计算方面的研究。情感计算在模式识别中开辟了研究语音情感识别的新领域，让机器在听懂人类语言内容的同时也能够识别说话人

【作者】

：

钟鸿科

【机构】

：

广东工业大学

【出处】

：

广东工业大学

【发表日期】

：

2017年期

【关键词】

：

语音情感识别支持向量机语音增强特征选取字典学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人工交互技术的飞速发展，越来越多研究者关注情感计算方面的研究。情感计算在模式识别中开辟了研究语音情感识别的新领域，让机器在听懂人类语言内容的同时也能够识别说话人的当前情感状态。然而目前情感语音识别系统的发展还不够完善，存在训练集质量不纯、没有确定最能表征情绪状态的特征参数和识别模型缺乏稳定性、高效性等问题，因此本文针对上述问题开展研究，有利于情感语音识别技术的发展，同时促进人工智能的学术研究和工程应用领域的发展。　　本论文基于传统语音情感识别模型框架，对基于级联式语音情感识别模型展开研究。本文主要内容如下：　　（1）设计了一个SVM级联式语音情感识别模型总体框架。该框架包含语音增强方法、情感特征选取和级联式识别模型三个设计模块，其中语音增强方法模块包括字典学习阶段和语音增强阶段；情感特征选取包括特征选择和特征筛选；级联式识别模型模块结合多级分类理论，从语音情感数据预处理开始，选择及筛选情感特征并搭建及优化级联式识别模型。　　（2）提出了基于一步字典学习（One-stage dictionary learning，OS-DL）的语音增强方法。该方法首先采用初始化系数矩阵方法为带相干性准则的批量最小角回归（Batch LARS with coherence criterion，LARC）算法的OS-DL算法分别学习得到纯净语言、噪音和带噪语音的幅度谱字典；接着将纯净语言和噪音的联合谱字典作为LARC算法的输入，对带噪语音幅度谱进行稀疏表示；最后将得到的稀疏系数矩阵用来估计纯净语音幅度谱，并基于带噪语音的相位信息重构出纯净语音。实验结果表明，在不同信噪比下，所提语音增强方法均能很好地抑制噪声，在提高语音质量的同时减少计算复杂度。　　（3）提出了新的语音情感特征选取方案。该方案首先从情感语音预处理出发，基于传统的情感特征选取方法提出新的低维特征组合方案；然后确定合适的筛选方法及各参数的值；接着在CASIA情感语料库数据集上验证了不同的单一识别算法下所提取方案的可行性和准确性；最后围绕识别效果最佳的一种识别算法，分析各个情绪之间的特征混淆度。仿真实验表明，所提特征选取方案有效地缓解了维度灾难和情绪混淆度大的问题。　　（4）提出了基于SVM级联式语音情感识别模型设计模块。该模型结合级联分类策略和SVM分类器具有较强的逼近、泛化能力，首先提出了两种级联式情感识别模型；然后分析各级分类器的分类结果，选择合适的分类器及确定各参数的值；接着选择识别率最高的模型，并将已选好的模型进行扩展；最后对模型结构进行优化。仿真实验表明，此识别模型能够很好地将混淆的情感区分开，从而提高了情感识别准确率。　　最后，通过相应的实验验证每一个模块所具有的优越性，以及验证本论文所提的情感语音识别总体模型的可行性、准确性和高效性。

其他文献

块迭代均衡技术在水声SC-FDE系统的应用研究

水声通信信道是一个时-空-频随机变化的信道，是所有通信信道中最为复杂的信道，阻碍了水下高可靠性、高速率通信系统的发展。多径时延扩展的水声信道使得接收信号出现严重的频率

学位

水声信道单载波频域均衡块迭代均衡技术SC-FDE系统

基于星形先验的图像自动化分割方法研究

图像分割作为本文的研究对象,指的是根据图像包含的信息和先验条件,把图像划分成各具特色的不同区域,并把图像中的目标分离出来的技术和过程。在计算机视觉、模式识别、图像

学位

显著性区域显著性点星形形状先验图切割AP聚类图像自动分割

适合于强度调制/直接检测的QAM/QPSK调制方案

自由空间光通信是以激光作为信息传输的载体,能够实现高速率数据传输的一种新兴的无线通信方式。具有宽带、高速、低成本、通信安全保密、无需频率许可等优点。它的使用可以

学位

无线光通信系统强度调制/直接检测正交幅度调制正交相移键控

基于FSM的HDCP系统研究与设计

近年来,随着数字高清设备逐渐走进千家万户,人们在享受高清设备带来的视听盛宴时,往往很少能够意识到在数字化的高清时代盗版问题给出版商带来了前所未有的挑战。在全球范围

学位

高带宽数字内容保护有限状态机认证数字内容保护

高速高精度电流舵数模转换器的研究与设计

数模转换器(DAC)作为沟通数字世界和模拟世界的桥梁，被广泛的应用在诸如数字信号处理、数字音频和视频、控制处理系统、有线和无线通信系统等领域。高速高精度DAC作为无线通信

学位

数模转换器电流舵工作原理静态性能驱动系统

以MCU为核心的干片机软件开发设计

嵌入式系统是一种专用的计算机系统，此系统能够执行独立的功能。随着社会信息化程度的提高，嵌入式产品在日常生活中所占的比例不断增加。以嵌入式产品替代传统产品成为一种常态

学位

嵌入式系统模块化软件开发干片机电路设计

基于C6713 DSK的MIMO-OFDM系统实现

随着无线通信技术的发展,如何提高系统的信道容量和抵抗多径衰落影响是亟需解决的两大问题。MIMO技术可以极大地提高系统容量,OFDM技术能有效地抵抗频率选择性衰落带来的不良

学位

多输入多输出正交频分复用空时编码快速傅立叶变换

基于双向单中继信道的物理层网络编码技术研究

移动通信的多元化发展，不仅方便了人们的日常工作，而且也大大丰富了公众的娱乐生活。以无线电波为传输媒介的无线通信系统，不可避免地受到无线衰落环境的影响。常规的无线通信系

学位

混沌调制物理层网络编码双向单中继信道中断概率空时编码

MIMO系统中球状检测算法研究

多输入多输出(MIMO)技术,就是在发送端和接收端均采用多根天线的通信模式,是无线通信领域的巨大突破,可以在不增加带宽的情况下,成倍的提高信道容量和频谱利用率,成为第三代

学位

MIMO球状检测初始半径半径序列折半查找union bound

CMOS流水线型ADC研究与设计

模数转换器（ADC）作为模拟信号转换为数字信号的桥梁，广泛应用于各种电子系统，是电子系统的关键部分。模数转换器不仅需要有较高的信号处理精度，而且需要有较高的转换速率和功率效

学位

流水线型有效位数模数转换器CMOS集成电路

基于SVM级联式语音情感识别模型

与本文相关的学术论文