【摘 要】
:
如何使计算机正确识别、理解和表述人类语音中的情感信息是人工智能领域是主要研究方向之一。在语音情感识别中,选取合适的情感识别模型是实现情感有效分类的关键之一,但是当前所使用的情感识别模型大多是对情感进行单独划分,并没有考虑到情感之间的相互影响。人类的情感不是独立的,而是以系统的方式相互关联。PAD三维描述模型在维度空间中从愉悦度、激活度以及优势度三个方面描述不同情感,因此,提出用PAD情感维度预测值
论文部分内容阅读
如何使计算机正确识别、理解和表述人类语音中的情感信息是人工智能领域是主要研究方向之一。在语音情感识别中,选取合适的情感识别模型是实现情感有效分类的关键之一,但是当前所使用的情感识别模型大多是对情感进行单独划分,并没有考虑到情感之间的相互影响。人类的情感不是独立的,而是以系统的方式相互关联。PAD三维描述模型在维度空间中从愉悦度、激活度以及优势度三个方面描述不同情感,因此,提出用PAD情感维度预测值表征情感之间的关联度,使用PAD情感维度预测值计算关联认知网络的权值,结合多层限制玻尔兹曼机构建深度情感关联模型,实验结果表明,本模型在TYUT2.0情感语音数据库的识别率达到80.85%,在EMO-DB情感语音数据库识别率达到95.74%,是一种可以有效进行情感分类的模型。本文主要研究内容如下:(1)使用PAD情感维度预测值计算情感之间关联度。因不同数据库甚至同一数据库中不同语句的PAD值都是不一样的,如果仅固定使用PAD值(基本情感PAD值)表示情感之间的关联程度会对识别效果造成影响,因此,提出使用PAD情感维度预测的方法针对不同情感语句进行PAD预测,并用预测值计算情感之间的关联程度,将情感关联度作为关联认知网络的权值。通过实验证明其有效性,实验结果表明,使用PAD预测值计算关联认知网络权值的方案在TYUT2.0和EMO-DB的识别率分别为76.60%、91.49%,使用基本情感PAD值计算关联认知网络权值的方案在TYUT2.0和EMO-DB的识别率分别为72.34%、87.23%。实验结果证明,使用PAD情感维度预测值可更好的表示情感之间的关联性。(2)深度情感关联模型超参数优化。为避免深度情感关联模型超参数设置的盲目性,提出使用遗传算法对模型的限制玻尔兹曼机隐含层节点数、动量因子、学习率、多层限制玻尔兹曼机的训练次数以及关联认知网络的训练次数等超参数寻优,并通过对比方案证明其有效性。实验结果表明,使用遗传算法优化模型超参数的方案在TYUT2.0和EMO-DB的识别率分别为78.72%、93.62%,根据经验调参的方案在TYUT2.0和EMODB的识别率分别为72.34%、87.23%。实验结果证明,使用遗传算法对深度关联模型超参数寻优可有效提升模型识别效果。(3)深度情感关联模型的改进。为进一步优化深度情感关联模型的结构,从语音信号时序信息入手,引入可捕获语音信号时序信息的门控循环单元,构建GRUs-ICN模型。实验结果表明,在同使用PAD预测值计算情感之间关联度和手动调参的条件下,GRUsICN模型的识别率为76.71%,深度情感关联模型的识别率为76.60%。实验结果证明,情感语音信号的时序信息有利于语音情感识别。
其他文献
近年来,煤炭生产技术日益发展,同时与之对应的煤矿安全形势更加成为生产中的重要评价指标。由于生产环境的恶劣和通信条件不足,煤矿井下无轨胶轮车管理仍然采用人工排班,电话调度方式。这种调度方式不仅工作量大、调度效率低,车辆利用率也不高,且车辆碰撞和车辆撞人事故时有发生。为了改变这种现状,除了进一步提高人为管理意识外,关键是建立信息化程度高、智能化程度高的车辆定位系统,形成井上/井下安全可靠的通信传输机制
如今短视频直播等以手机终端为载体的业务盛行,通信网络中的数据流量急速上涨,这也让被用来传输数据的带宽资源,尤其是无线网络资源出现供不应求的情况。D2D(Device-to-Device)技术经研究可解决网络资源供求问题。作为通信系统的重要技术参考,D2D优势体现在频谱利用率、系统容量、吞吐量等指标上。数据传输时D2D用户和一般用户的设备存在着频谱资源的共享会形成同频干扰问题。将频谱资源进行有效地整
平板显示产业是战略性基础产业,平板显示器作为智能终端设备的关键部件,其市场需求呈较快增长趋势,在平板显示器的模组组装后段制程中,偏光片贴附设备是其最为关键的设备之一。偏光片也叫偏振光片,是液晶显示器模组重要的组成部分,所有的液晶面板都必须在液晶玻璃上贴附偏光片。在偏光片的贴附工艺中,贴污和贴偏是产生贴附不良的两个主要原因,贴污会造成外观凸点、电测坏点、贴附气泡等问题,贴偏会造成显示区漏光、图像扭曲
近年来,国家电网公司加大了对智能电网的应用研究,而电力通信网是智能电网发展的基础。同时,伴随着各类型的通信网络在各行各业的建设运行,骨干通信网技术逐渐成熟。在电力行业,作为各类电力业务交互的主要承载网络,电力通信技术无论在安全性和重要性方面与其他行业相比都重要许多,在电网的各个生产环节,包括输电、变电以及配用电环节,都离不开骨干传输网。同时,骨干传输网建设成效将直接影响基建生成、调度自动化、营销服
坦克载具驾驶在国家军队训练中具有举足轻重的地位,但在实际训练中,存在着风险系数高、训练成本高等弊端。在军事训练中,坦克车运动的驾驶(包括普通驾驶和射击)是坦克车训练的重要组成部分。结合虚拟现实技术,通过计算机软件建立相应的训练模型,并制作相应的硬件来模拟逼真的训练环境,使训练者能够与所建立的虚拟环境中的场景模型和对象模型进行交互,从而产生逼真的模拟效果达到训练目的。本文通过分析现有坦克载具模拟训练
随着信息时代地不断发展,闪存器件在其中扮演着越来越重要的作用。相比于其他的存储器件,基于氧化还原反应的POM分子闪存器件具有高热稳定性、与CMOS制造工艺兼容、可掺杂活性杂原子、快速的写/擦除操作以及超过10年的保持特性等优势。为了缩短POM分子闪存器件的研究时间,提高器件研究效率,物理模型地搭建是一个必须经历的步骤。闪存器件充放电过程是研究器件性能的关键点,然而在实现器件充放电模型搭建过程中存在
当前随着卫星技术的不断发展,不仅为全球提供了丰富的通信服务,而且在军事、农业、物流等各个方面都发挥了关键的作用,极大的改变了人类的生产、生活方式。随着商业航天概念的兴起与发展,科学技术的进步及商业航天思想的进一步解放,小卫星作为其主要载体,已经成为商业航天领域最重要的设备之一。在商用微小卫星发展的同时,也对星载天线提出了更高的要求,由于微小卫星的模块化、高度集成化设计,要求星载天线能够实现低剖面、
近年来,脑疾病逐渐成为影响我国国民身体健康的一大隐患,据统计,每年我国有超过百万级国民因脑部疾病而死亡。随着医学影像技术的发展,磁共振(Magnetic Resonance,MR)成像因其高效性和安全性,被广泛应用在脑功能和脑部病变的检测中。脑MR图像成为深入研究和分析脑组织以及脑部疾病的重要媒介。其中对脑MR图像的分割作为后续脑图像分析的预处理环节,其分割效果直接决定了后续研究的结果,是对脑组织
计算机断层扫描在影像学诊断中占据着举足轻重的地位,然而在检测过程中所引起的辐射剂量暴露也是一个值得我们深思的潜在问题。在医学诊断中,为了降低辐射暴露风险,通常会采用降低管电流或管电压的方式来实现辐射剂量的减少,这种方式可以避免给患者提供过多的X射线辐射,但放射剂量的减少在降低辐射暴露风险的同时,也提高了噪声水平,这使得在重建结果中极易加重条纹伪影的产生,构建的图像也会因噪声和伪影的存在而出现严重退
数字微波安全传输是保证广播电视安全播出和党和国家法令顺利实施的一种战略备战资源。数字微波传输即同步数字SDH系列的发展,为广播电视节目信号的微波传输提供了更稳定的硬件基础。近年来随着山西省广电业务增加,庙前山-汾阳-霍山作为省内重要的干线微波枢纽站,南线设备已经不能满足现在广电微波传输的需求,所以需要改造庙前山—汾阳—霍山两跳SDH制式3+1机架式微波设备。本文结合了山西省广播电视微波线路重要干线