基于PAD情感三维模型的语音情感分析算法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:massmass
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来计算机领域内人工智能技术的飞速发展,情感计算作为人工智能发展高级阶段的产物之一也逐渐成为该领域内的重要组成部分。当人工智能聚焦于提高人机交互的亲切度和准确度,真正实现自然和谐的人机交互时,准确识别分析人类的情感即是解决问题的关键所在。因为人类情感具有复杂性,微妙性,连续性,所以诸多国内外的研究人员已经把目光转移到情感计算领域内的维度情感研究方向上。语音作为人类交互方式中最直接有效的一种,在传递信息的同时也能很好地表达出自己的情感以及相应的变化,通常借助特殊的语气助词、语调的高低变化等方式。本文从语音情感的角度出发,通过构建适用于PAD(Pleasure-displeasure Arousal-nonarousal Dominance-submissiveness,PAD)三 维情感空间的回归预测模型来探索情感维度和离散情感之间的关联性。其中涉及到一种语音情感特征与PAD预测维度相结合的级联分类方法,并在研究中通过采用网格算法和粒子群算法相结合的算法来优化SVR(Support Vector Regression)参数的方式构建了维度情感语音PAD预测模型,实验得到了较好的结果。主要工作有以下几点:(1)通过分析不同情感特征在情感维度预测过程中的效果,提取CASIA情感语音数据库中的梅尔频率倒谱系数、线性预测系数、韵律特征、共振峰频率特征四类语音特征用于情感语音识别的研究,并使用与Pearson相关系数与PCA(Principal Component Analysis,PCA)算法相结合的方法完成PAD预测时的情感特征降维。在对情感特征进行选取的过程中应用到了 PCA特征降维算法,该算法起到了消除情感特征间关联性的作用。在后续实验中证明该算法提升了对PAD维度的预测效果。(2)通过分析在PAD维度预测方向中传统SVR模型的欠缺,研究拟采用PSO(Particle Swarm Optimization,PSO)算法和网格算法相结合的SVR回归模型。利用PSO算法的全局搜索较强的特点结合网格算法局部搜索精度较高的特点来完成对SVR模型参数优化,降低了在模型参数选择时的盲目性,利用该模型预测PAD的实验结果并进行横向对比,数据结果显示优化后的实验数据有明显的改善。(3)将PCA特征降维方法与SVR模型相结合,提出了 PCA-GAPSO-SVR回归模型。利用该模型预测PAD维度,根据实验结果得出该模型较PCA-SVR和GAPSO-SVR(具有更好的预测PAD维度能力。为了进一步证明该回归模型对PAD维度预测的准确性)在预测性能上有明显的提升。设计验证该模型于PAD维度有更好的实验结果时,采用了三组情感识别分别进行实验并对比,第一组是利用直接提取的四类情感特性 MNFF(MFCC Feature,Nonlinear Feature,Fusion Feature of Prosodic Feature and Formant,MNFF)特征识别情感,第二组是分别利用由三类模型(PCA-SVR、PSO-SVR、PCA-PSO-SVR模型)实验得到的PAD维度数据直接进行情感识别,第三组则将前两组的特征组合成新的特征集进行情感识别。对三组实验的数据结果分析后可知,最后一组采用新特征集的实验有最佳识别率
其他文献
氢燃料电池是一种能量转化效率高、污染物排放为零的新能源转化装置;其阴极发生氧气的还原反应,反应速率低、反应步骤多、中间产物复杂,是燃料电池能源转化效率的决定性步骤。目前阴极氧还原反应依赖于昂贵的铂基催化剂,开发可替代铂碳的非贵金属碳基氧还原催化剂,对推动氢燃料电池发展具有重要意义。多孔碳具有良好的导电性、出色的化学稳定性、高的比表面积和易于调控的组分,是常见的电催化电极材料之一。通过调控多孔碳材料
内分泌干扰物质是一类可能干扰体内激素作用的外源性化学物质,这类物质主要作为核受体的配体干扰细胞的转录过程,影响人体的内分泌功能,破坏内分泌系统功能,对人体健康产生负面影响。大量的研究表明环境中普遍存在内分泌干扰物质,天然水体、土壤、沉积物乃至室内灰尘中都检测到破坏内分泌的化学物质。肝X受体(LXRs)是核受体家族的成员,是细胞和机体内的胆固醇敏感元件。LXRs可以通过调节泡沫细胞的形成和体内炎症因
在云制造行业细分化应用的新兴趋势下,电子制造行业作为高端制造领域中智能化和自动化程度较高的细分制造行业领域,拥有制造行业云的广阔应用前景。其中,设备资源属于电子制造行业应用广泛的核心硬制造资源,其特征性和专业性在通用型云平台资源描述过程中易被弱化,导致其交叉行业误调用后服务失败,同时,制造资源云池中设备搜索结果不理想等应用窘况在行业云发展各阶段时有发生。如何为电子制造云平台设立专业特征性的设备注册
经过近40年的快速发展,当前社会乃至国家对于发展速度的热切追求已经逐渐趋于平稳,人性化的城市空间成为了全体居民所向往之地,这也趋使着我国城市发展逐步从快速发展模式转向高品质发展模式。在国家大力推行供给侧改革的背景下,以快速扩充为目的的传统规划已经难以满足发展的需求,面对愈演愈烈的城市空间的高品质更新困境,许多城市都开展了关于社区生活圈的探索建设。较之传统的规划,社区生活圈规划建立在人的日常行为模式
抗生素在兽药和畜禽养殖饲料添加中普遍应用,由于生物体对抗生素的代谢利用率低,大部分抗生素以原药或代谢产物的形式随畜禽粪污进入环境中,造成抗性基因的传播,诱导超级细菌的产生,引发一系列生态安全问题。畜禽养殖抗生素的分布特征和去除特性成为目前的研究热点。本论文针对某集约化养猪场,进行磺胺嘧啶(SDZ)、磺胺二甲嘧啶(SMZ)、四环素(TC)、土霉素(OTC)和环丙沙星(CIP)等5种典型抗生素的浓度赋
在人车矛盾日益突出的今天,人们逐渐开始关注城市的可步行性。步行具有重要的社会意义与经济效益。日常服务设施作为引发步行出行的目的地,合理的布局能够提升步行出行率,对于集约资源、降低污染、提升居民健康水平等具有重要意义。近年来,随着网络的快速发展,大数据分析逐渐受到学者的青睐。国内外关于可步行性测度研究方法较多,其中“步行指数”得到了大多数学者的认可,步行指数得分高的区域的日常设施布局相对成熟。目前,
作为一种温室气体,二氧化碳(CO2)虽然在维持地球适宜的气候和环境方面发挥着至关重要的作用。但化石燃料燃烧所产生的过量CO2引起了全球变暖、海水酸化等环境问题。幸运的是,CO2是一种高丰度、低成本、无毒和可再生的C1资源。CO2的化学固定既可以实现CO2资源的最大化利用,为高附加值化工产品提供新的绿色合成路线,又有助于缓解环境问题,这是可持续化学中一个非常有吸引力的研究领域。其中,CO2-环氧化物
人工电磁超表面由于其不同寻常的电磁响应特性在电磁吸波、太赫兹器件、非线性光学、光谱成像和微波通信等领域都有着广泛的应用前景。事实上,电磁吸收在诸如隐身技术、电子信息对抗、电磁兼容、防护辐射、生物传感和新能源技术等军用和民用方面扮演着重要的角色,因此具有亚波长尺寸、完美吸波效果的电磁超表面吸波体得到了广泛的研究和设计。目前常用电磁吸波体是电磁波单方向入射的单通道吸波体,这类吸波体追求高吸收率、宽吸收
重庆城口县受到高山特殊的地形特点和地理位置影响,有丰富的自然资源和多元的文化,但是乡村建设受到了地域条件限制,乡村发展处于起步阶段。随着乡村振兴的开展,政府为解决高山居民生活难的问题,针对传统、封闭、边缘、边远、自给自足的山区居民,建设移民安置点实行易地搬迁。移民安置点成为了居民生活与劳动的物质载体,安置点外部空间承担着居民日常生活交流的场所。然而近年来粗犷式建设使移民安置点外部空间出现生态受到破
在互联网的快速发展与普及下,越来越多的人开始学习编程。代码补全作为编写代码过程中一项重要的提高编码效率的服务,受到越来越多人的喜爱。随着技术的发展,用户希望代码补全的智能程度可以有进一步的提升。代码补全是源代码建模下游分支任务之一,使用深度学习的方法实现代码补全使得利用统计语言模型对源代码建模探索了各种各样的可能性。循环神经网络(RNN)作为自然语言处理(NLP)技术中一个通用的特征提取器已经被广