语音情感识别训练系统设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:surplushui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音情感识别作为自然和谐人机交互的关键技术之一已经取得许多进展。各种理论和方法不断推陈出新,但是由于缺少一个通用的语音情感识别实验平台,研究者都基于自己的实验平台进行理论分析,从而导致各种理论之间的对比分析存在较大的主观性,可比性差,后续研究者重复实验、验证算法都存在较大的困难。为此,本文通过设计和实现一个语言情感识别训练系统,尝试构建一个通用的语音情感识别实验平台,希望为不同的研究者提供一个良好的协同工作平台。本文首先通过对语音情感识别各个阶段的功能和特性的分析,研究了语音情感识别训练系统设计中的关键问题。然后,通过对系统进行需求分析,提出了系统整体方案,并对系统功能模块、控制流程、数据流程等做了详细设计,并运用软件工程的理论和方法来指导设计,采用设计模式的相关理论来提高系统的稳健性和灵活性,在基于VC++与Matlab的混合编程环境下,设计和实现了一个语音情感识别训练系统。该系统基于EMO-DB德语情感语音库的高兴、愤怒、平静、悲伤四类情感进行实验。提取了基音频率、短时能量、过零率、前三阶共振峰、前12阶MFCC分别在每一帧上的统计特征,得到了一个90维特征集。运用SFFS和GAFS两种特征选择算法对情感特征集进行了降维处理,采用SVM方法对情感信号进行建模和识别。最后,通过对系统进行了各种语音情感实验,包括基本语音情感特征的独立测试与组合测试、多种特征选择算法的对比以及各种算法的组合实验,对实验结果进行了分析,并与同类文献实验结果进行了对比分析,验证了系统的有效性、稳定性与灵活性。系统测试结果表明,该系统支持语音情感识别各阶段主流的方法,能够方便地导入和修改情感识别所需的算法,能够灵活地组合多种算法进行实验。系统稳定、灵活、可扩展,通过这个平台,研究者能了解、学习他人的研究过程和方法,能在此基础上添加算法、扩展功能,验证自己的算法及对比优劣,可以作为一个开放的平台供后续研究者使用,为不同研究者提供了一个良好的协同工作平台,减少重复劳动,提高实验效率,更好地推动语音情感识别的发展。
其他文献
目的:久坐行为已经被世界卫生组织列入导致疾病和死亡的十大元凶之一,并且也有研究指出,久坐行为会增加人体的死亡风险。久坐行为提高了糖尿病、心血管疾病、癌症、心理疾病
介绍了三维设计技术与传统二维平面设计技术的不同点;结合实际工程项目,描述了三维设计技术在选煤厂设计项目的方案筛选、投标、施工图设计、设备布置、非标件详图设计、管道
介绍了石灰石烧结-低温拜耳法、预脱硅-碱石灰(石)烧结法、酸法及硫酸铵法四种较成熟的从粉煤灰中提取氧化铝的工艺技术,并对氧化铝市场及发展情况进行分析研究,认为开发粉煤灰提
由中国煤炭加工利用协会和中国煤炭工业协会选煤分会共同举办的首届“2009’中国国际煤炭加工利用展览会”,于10月14—16日在西安举行。国家能源专家咨询委员会副主任、中国煤
服装是一种基于身体的设计,与人的身体息息相关,从而与其他设计显示出独特的审美特征。服装依身体而存在,身体以服装而表现自身。但在服装的设计史中身体曾一度处于被悬置与
针对普通隔爆除铁器及双极隔爆除铁器存在的问题,研发了模块组合式双极隔爆除铁器,介绍了该除铁器的结构及安装程序,经过实践,又对除铁器进行了新的改进,使其具有结构简单,安装、调
我国是一个信仰自由的,由本土宗教(道教)与外来宗教(佛教、伊斯兰教、基督教、天主教)及大量民间信仰组成的多宗教多信仰国家。围绕着宗教和民间信仰而产生的经济活动,贯穿在人类文明和宗教发展的历程中,说它们是最悠久的“传统行业”实不为过,其庞大的经济体量和独特的运营方式历久弥新。而今,互联网已经融入人们工作生活的各个环节,宗教及民间信仰与互联网的融合也同样会越来越紧密。本文运用创业管理的相关理论,通过对
采用第一性原理计算考察β12硼烯纳米带(BNRs)的结构和电子性质.结果表明:不同宽度、不同切割方向的BNRs均具有金属性,且BNRs的稳定性随宽度的增加而增加;用H原子钝化BNRs边
随着地层供液能力的下降和低渗、超低渗透等非常规油气藏的开采,使得国内低产油井数目庞大且呈逐年上升趋势。但是,油田普遍使用的API最小泵径为φ32mm,抽汲能力远大于低产油
毛建草是山西宁武芦芽山的野生植物,在当地常被加工成“毛尖茶”饮用,但是原材料均采自野生原材料,限制了毛建草资源的开发利用,影响了“毛尖茶”产量。毛建草种苗的生产有利