论文部分内容阅读
近年来,语音情感识别作为自然和谐人机交互的关键技术之一已经取得许多进展。各种理论和方法不断推陈出新,但是由于缺少一个通用的语音情感识别实验平台,研究者都基于自己的实验平台进行理论分析,从而导致各种理论之间的对比分析存在较大的主观性,可比性差,后续研究者重复实验、验证算法都存在较大的困难。为此,本文通过设计和实现一个语言情感识别训练系统,尝试构建一个通用的语音情感识别实验平台,希望为不同的研究者提供一个良好的协同工作平台。本文首先通过对语音情感识别各个阶段的功能和特性的分析,研究了语音情感识别训练系统设计中的关键问题。然后,通过对系统进行需求分析,提出了系统整体方案,并对系统功能模块、控制流程、数据流程等做了详细设计,并运用软件工程的理论和方法来指导设计,采用设计模式的相关理论来提高系统的稳健性和灵活性,在基于VC++与Matlab的混合编程环境下,设计和实现了一个语音情感识别训练系统。该系统基于EMO-DB德语情感语音库的高兴、愤怒、平静、悲伤四类情感进行实验。提取了基音频率、短时能量、过零率、前三阶共振峰、前12阶MFCC分别在每一帧上的统计特征,得到了一个90维特征集。运用SFFS和GAFS两种特征选择算法对情感特征集进行了降维处理,采用SVM方法对情感信号进行建模和识别。最后,通过对系统进行了各种语音情感实验,包括基本语音情感特征的独立测试与组合测试、多种特征选择算法的对比以及各种算法的组合实验,对实验结果进行了分析,并与同类文献实验结果进行了对比分析,验证了系统的有效性、稳定性与灵活性。系统测试结果表明,该系统支持语音情感识别各阶段主流的方法,能够方便地导入和修改情感识别所需的算法,能够灵活地组合多种算法进行实验。系统稳定、灵活、可扩展,通过这个平台,研究者能了解、学习他人的研究过程和方法,能在此基础上添加算法、扩展功能,验证自己的算法及对比优劣,可以作为一个开放的平台供后续研究者使用,为不同研究者提供了一个良好的协同工作平台,减少重复劳动,提高实验效率,更好地推动语音情感识别的发展。