【摘 要】
:
情感在人类的感知、决策等过程中扮演着重要角色。在人工智能迅速发展的今天,开发具有情感智能的人机交互方式有着极其重要的理论和实际意义。语音作为人类最重要的信息传递
论文部分内容阅读
情感在人类的感知、决策等过程中扮演着重要角色。在人工智能迅速发展的今天,开发具有情感智能的人机交互方式有着极其重要的理论和实际意义。语音作为人类最重要的信息传递方式,携带着丰富的情感信息,目前基于语音信号的情感识别研究已受国内外相关研究机构的广泛关注。本文针对四类常见的情感状态:生气、高兴、悲伤和惊奇展开语音情感识别研究。首先在现有语料库的基础上,对声学韵律特征和共振峰特征的情感区分能力进行了分析,并选择在基频、能量、语速和共振峰等参数的基础上衍生出情感特征。接下来使用Elman反馈网络进行语音情感识别,与常用的MLP(Multiply Layers Preceptor)相比该模型能够处理情感时序特征,更接近人耳连续的听觉机制。情感识别领域中广泛使用的情感特征按照时间粒度的差异可分为基于语句(utterance based)的全局统计特征和基于语音帧(frame based)瞬时特征,但这两类特征的时间粒度选取是否合理并未得到验证,于是提出使用基于语段的特征用于语音情感识别,并给出“最佳识别段长”的概念。实验表明,系统识别率同语段长度有着较强的相关性,系统识别率在使用段长为140帧/段的语段特征时达到最高,与使用全局特征相比系统性能提高了4.2%。通过比较使用全局统计特征时的识别结果和使用基于语段的时序特征的识别结果,可以得出这样的结论:全局统计特征和时序特征侧重于在不同的情感维度上区分情感。最后,为进一步提高系统识别性能,构建了Global Control Elman网络将两类特征相融合。经过特征融合后的系统识别率与分别单独使用全局统计特征和时序特征均有所提高,达到66.0%。上述相关研究工作为后期进行深入的语音情感识别技术研究打下基础。
其他文献
工程扫描仪广泛应用于印刷、科研、医疗等领域,本研究来自于西安电子科技大学海光数码公司工程扫描仪的设计与开发。该扫描仪的应用软件主要是依赖于第三方图像处理软件来实
随着我国经济和城市建设的迅速发展,城市的安全规划和城市突发重大事故的应急救援日益成为不可忽视的问题。为了及时、有效的处理各种紧急事件,保证城市的开发建设和企事业单
近几年来随着专用集成电路ASIC(Application Specific Integrated Circuit)的迅速发展和系统芯片SoC(System on a Chip)复杂度的不断提高,芯片验证,尤其是功能验证日益成为电子
矩阵重建作为一种新的高维数据分析和处理的工具已经被广泛的研究和应用。然而,矩阵重建的求解算法都需要经过多次迭代,同时在每一次迭代过程中又要进行大规模矩阵的奇异值分解
随着计算机和internet技术的飞速发展和广泛应用,传统的出版和传播方式将发生根本性的改变。然而网上的复制、篡改、盗版以及非法传播严重的威胁着作者的版权。数字水印作为
网络信息化日益发展的今天,完成特定目的和解决一定问题往往需要多个部门、单位和系统共同协作完成。在计算机软件解决问题时,同样需要多个软件单元、模块和组件共同协作完成系
随着互联网技术和人工智能技术的快速发展,尤其是近年来智能控制技术和计算机网络技术在家庭中的广泛应用,各种智能家电和智能网络设备相继出现,并且人们对家居领域中的各种电器
本课题首先对Web文本挖掘关键技术进行了深入的研究,讨论了网页采集、分词、词频统计和特征权值计算等文本预处理的相关技术。然后,分析了Web文本聚类算法,由于Web文本数据的
脑电信号是从头皮记录到的脑细胞群的自发性或诱发性电活动,它是人脑内部各种活动的外部表征,蕴含着丰富的生理、心理及病理信息。脑电信号的分析及处理无论是对临床上一些脑
软件复用度量是软件复用技术中不可分割的一部分,在软件复用开发中占据重要地位。软件复用开发与传统的软件开发方式不同,从而影响到软件度量,因此需要新的软件度量方法,软件复用