【摘 要】
:
情感是人类表达个体思想的主要方式,在日常生活中占据着非常重要的地位。情感识别是当前人工智能和人机交互领域的重要研究内容,被众多研究人员广泛关注。情感识别的早期研究大多基于单一的模态,随后发现采用单一的模态进行情感识别具有很大的局限性,而不同模态之间提取的情感特征在一定程度上能够互补,通过对不同模态融合进行情感识别,能够进一步的提升识别精度。语音和人脸表情是人类表达情感最快捷、直接的方式,成为了情感
论文部分内容阅读
情感是人类表达个体思想的主要方式,在日常生活中占据着非常重要的地位。情感识别是当前人工智能和人机交互领域的重要研究内容,被众多研究人员广泛关注。情感识别的早期研究大多基于单一的模态,随后发现采用单一的模态进行情感识别具有很大的局限性,而不同模态之间提取的情感特征在一定程度上能够互补,通过对不同模态融合进行情感识别,能够进一步的提升识别精度。语音和人脸表情是人类表达情感最快捷、直接的方式,成为了情感识别研究中重要的模态。近年来,深度学习被广泛应用在人工智能的众多领域,并取得了相当不错的成就。因此,本文利用深度学习技术的优势,将其应用于双模态情感识别,开展了基于深度学习的语音和人脸双模态情感识别的相关研究,具体的工作内容如下:1.针对目前大多数研究采用一维的语音信号作为输入,忽略了时域与频域的相关性,以及未处理无声的帧和与情感无关的帧,生成情感特征区分性不强的问题,提出了注意力感知的深度卷积神经网络语音情感识别模型ADCNN。该模型将语音信号的对数-梅尔谱图及其一阶、二阶差分系数作为卷积神经网络的输入,为每个语音片段提取深度特征;然后结合时间金字塔匹配算法,将维度不固定的片段级情感特征转换为具有固定维度的话语级情感特征;最后通过注意力机制给提取到的特征赋予不同的权重,利用SVM分类器实现情感分类。实验结果表明,ADCNN模型更好的关注了语音信号时域和频域的相关性,生成了区分性更强的情感特征,从而提升了准确率。2.针对单一的模态进行情感识别具有很大的局限性,不同模态之间提取的情感特征在一定程度上能够互补,提出了语音结合人脸的双模态情感识别。对于语音信号使用ADCNN提取特征,对于人脸图像使用3D-CNN网络提取人脸表情情感特征。然后通过DBN模型构建的融合网络对两种模态的特征进行融合,更好的结合两个模态提取到的特征之间的关系。最后把双模态的融合特征作为支持向量机SVM的输入进行情感识别。实验证明,双模态情感识别能够弥补单一模态的局限性,取得了更高的情感识别准确率。
其他文献
近年来,利用计算机控制技术、人工智能技术和通信技术可以实现更好的交通容量和交通安全。智能驾驶系统中的车道偏离预警系统、智能巡航控制、车辆碰撞预警系统等功能,提高了车辆行驶的智能性,大大地减少交通事故发生,提高了交通系统的安全性。视觉感知是智能驾驶系统关键的技术之一,智能驾驶车辆所做的所有重要决策都依赖于对周围环境的视觉感知。基于感知结果,智能系统才可以进一步做出控制和操纵车辆的决策。本文主要利用机
惠更斯超表面是一种新型超表面,与其他的超表面相比,惠更斯超表面在结构构建上包含电谐振和磁谐振两部分,通过调节电谐振和磁谐振的结构参数,惠更斯超表面可以实现对电场和磁场的单独调控,从而实现对电磁波的自由调控。由于惠更斯超表面对电磁波出色的调控能力,因此广泛用于平板透镜、极化转换器、成像系统等器件的设计。本文围绕惠更斯超表面的电磁特性及其在天线上的应用展开研究,详细分析了惠更斯超表面的工作原理,并且设
随着物联网(Internet of Things,Io T)的快速发展与大规模应用,单一的传统通信技术已经无法满足物联网时代的需求,有针对性地使用两种或多种技术的组合,作为智能终端在物联网中的通信技术已成为必然。本课题将同时使用可见光通信(Visible Light Communication,VLC)与电力线通信(Power Line Communication,PLC)作为物联网的通信技术,以
近些年,携带螺旋相位波前的涡旋电磁波引起了各国科研人员的极大兴趣。由于涡旋电磁波具有螺旋相位的波前分布特点,使得它在通信传输、量子编码、粒子操纵、光学成像以及光刻技术等领域具有广阔应用前景,尤其在通信领域应用潜力巨大。由于轨道角动量是描述电磁波物理属性的新维度,因此如果对电磁波的轨道角动量进行单独编码或者作为载波携带信息,再结合传统的波分复用、正交幅度技术以及极化分复用等复用技术,可以极大提高通信
全球卫星导航系统(Global Navigation Satellite System,GNSS)作为一个国家现代智能信息化发展的重要基础设施。在近40年来,卫星导航在国家国防安全、社会经济发展以及人民日常生产生活等领域都发挥着越来越重要的作用。GNSS导航信号从卫星传到用户两万公里左右的传输过程中存在着复杂的空间电磁环境,且由于系统脆弱性,系统突发事故等,为了保证系统信号的可靠安全,需要对卫星信
通常,消费者在线购物时会根据商品的专有名词以及一些属性信息对其进行检索,用户在浏览商品时也会关注于商品属性方面的信息特征,因此分析出商品信息中关于特定属性方面的观点信息对提升商品的服务与质量是有必要的。细粒度的用户观点对商品的认知具有引导作用,可以影响消费者的购物决策,同时也为企业了解产品的属性特征提供了必要的信息反馈,具有重要的参考价值。本文的主要工作围绕着商品的观点分析展开,意旨分析出更详细、
目前,对海量数据的研究主要集中在对数据的存储、检索、挖掘和分析等方面,并且基本上都是基于某一特定的应用场景以及特定的数据源而进行的研究。互联网飞速发展和广泛应用的今天,短时间内就会有大量的、各种各样的数据产生,这些数据有表格、文本、音频、视频等,数据的存储格式也各不相同、各有特点。现实中,也会因为某种需要,要求对这些多源异构数据进行集中统一存储管理,而同源同构数据下的技术方案和算法并不能直接用于对
近年来,随着我国高等教育的迅猛发展,大学毕业生也日益增多。尽管就业岗位的数量在不断增加,但我国劳动力市场的供需失配的结构性问题依然非常严重。如今,随着互联网的普及,网络招聘成为企业招聘人才的主流方式。招聘信息中列出的技能词为实时、准确地了解企业对人才的需求提供了可能。本文将技能词抽取任务转化为序列标注问题,借鉴了命名实体识别或者术语抽取的方法。然而,由于中文的语义和上下文情形的复杂性以及手工标注成
人体动作捕捉技术一直是计算机视觉和计算机图形学研究的热点之一,这项技术被广泛应用于机器人、虚拟现实、影视动画、步态康复和运动分析等各项领域。现有的动作捕捉方法大多数都需要为实验者佩戴相关的动作传感器,设备昂贵并且对采集的环境有较高的要求;其它的一些方法则是利用数据集驱动人体建模完成三维动作的重建,这种方法过于依赖数据集的特征,扩展性较低。因此本论文提出通过深度学习和双目立体视觉相结合的方法实现人体
随着大规模集成电路的发展,网络通信数据量的激增,对高速数据传输系统的要求越来越高,传统的基于电互连的片上网络由于集成过多的IP核会导致高功耗、易受电磁干扰、高传输时延等问题,限制着未来多核处理器的发展。相对比电互连片上网络,光互连片上网络由于带宽大、传输速度快、不易受电磁干扰等优点,逐渐受到科研院校的关注,但在数据量小、路由距离较近的情况下,光互连片上网络的优点无法弥补光电转换过程和链路配置带来的