基于多模态的情感识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:FOFOXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感作为人类表达和交流的重要部分,要使计算机理解和识别人类情感具有重要的研究意义和应用价值。情感识别研究主要分为单模态情感识别和多模态情感识别两种,按照情感识别类型又可分为离散情感识别和连续情感识别。离散情感识别将情感类别作为识别目标,忽略了情感复杂性和情感粒度,而连续情感识别通过建立情感空间将情感强度值映射为具体的情感属性,有效克服了离散情感识别的缺点,使得情感识别更精确。又由于单模态情感识别存在模态局限性,无法充分利用各模态之间的互补性,故本文选择利用多模态情感特征进行连续情感识别。本文主要研究内容如下。1.本文针对人类情感主要通过语音和视频两种媒介进行表达,确定选取语音和视频进行多模态情感识别研究,同时结合多模态情感识别中常用融合策略方法的优缺点,提出了一种新的混合融合预测方法,首先分别对语音和视频单模态进行特征级融合回归预测,然后对预测序列进行多模态决策级融合回归预测,该混合融合预测方法不仅克服了单模态预测的局限性,更能很好的利用各模态之间的互补性,有效提升整体情感预测的准确性。2.本文针对语音和视频情感识别常用模型所存在的预测精度差、无法对高维特征进行预测等问题,提出了利用深度Bi LSTM模型进行单模态连续情感回归预测,充分利用循环神经网络优异的表征学习能力,同时也有效利用语音和视频单模态情感的连续性和上下文相关性,通过实验数据表明,该网络模型在单模态情感回归预测中具有较高的准确度。3.本文针对决策级融合策略方法存在预测偏差大和稳定性较差的问题,提出了一种基于注意力机制的局部绝对误差极端梯度提升算法模型——Attention-LAEXGBoost,作为多模态情感回归预测的决策级融合策略方法,充分利用了局部注意力机制聚焦局部性的能力和XGBoost模型优异的泛化性能,通过实验数据表明,该模型具有较高的准确性和鲁棒性,在Arousal和Valence情感维度空间CCC指标分别达到了93.42%和93.78%。4.本文综合连续情感识别研究的技术要点,结合本文所提出的单模态情感回归预测模型、多模态融合策略方法以及Attention-LAE-XGBoost融合回归预测模型,设计了一款基于语音和视频的情感识别系统,将本文所提出的模型和方法嵌入到系统中,通过采集实时视频和外部导入视频进行测试,验证本文所提出的情感识别方法的有效性和实用性。
其他文献
本硕士论文主要研究二维耗散Euler方程组的强轨道统计解以及三维MHD-α方程组的统计解问题.论文首先应用二维耗散Euler方程组的强轨道吸引子构造出该方程组的强轨道统计解,并证明该强轨道统计解具有不变性且满足Liouville型定理.然后论文证明了三维MHD-α方程组的解算子生成的过程存在拉回吸引子,并证明拉回吸引子上存在不变Borel概率测度,且该概率测度满足Liouville型定理,是该方程
随着大数据、人工智能的发展,农业也逐步趋向智能化,形成了智慧农业。智慧农业主要通过感知、跟踪、监测、预测和数据分析等技术对传统农业进行改造,从而实现农业的智能化决策、精准化生产和可视化管理。在现代农业中,农作物的病害类型主要依靠种植人员的经验来判断,容易出现误判病害类别的现象。这不仅阻碍了农作物种植技术的进步和发展,而且带来了一系列的环境污染问题,因此自动化识别植物病害在智慧农业中至关重要。本文将
随着国家对水资源的重视及一户一表等政策的落实,水务公司和用户对智能水表的需求也越来越强烈,智能水表的持续发展需要更多新技术来支持水务公司和用户对水资源使用的管理。
近年来,我国持续推进供给侧结构性改革,促进产业结构的优化升级,虽然在这种情况下,我国混凝土行业的发展较为稳定,但是,对我国混凝土企业来说,其面临的生存环境还是比较复杂和严峻的。目前,我国大多数混凝土企业的绩效评价方法还比较落后,在评价的过程中缺乏战略视角,在此形势下,我国混凝土企业必须转变思想观念,建立以战略为导向的绩效评价体系,提高企业的绩效管理水平。而平衡计分卡就是在战略的基础上进行绩效评价,
有效的描述目标图像以适用于后续的目标识别任务是计算机视觉研究领域的一个基础性的问题。描述叶片图像模式用于植物种类识别和抽取蝴蝶图像特征用于蝴蝶种类识别是目标图像描述中的重要应用。植物叶片图像模式和蝴蝶图像模式一般都有着小的类间差异和大的类内差异,目标的形状扭曲、自遮挡,以及图像获取中的光照的变化,目标图像内部的复杂结构等,都给目标的识别任务带来很大的困难。本文提出了一种称为高斯卷积角不变量描述子,
电子商务行业在快速发展的同时,信息量呈爆炸式增长,人们淹没在信息过载问题中,推荐系统应运而生。在大数据时代下,传统的推荐算法不再能满足需求,本文根据天池竞赛提供的用户行为数据,基于特征工程和模型构建两个方面,构建用户购买商品的概率预测模型,从而提高商品的购买转化率。本文首先对原始用户行为数据进行探索性分析并清洗数据,为后面的模型提供数据支撑。其次从用户、商品和用户行为三个角度出发,构造了近100维
由于移动互联网的不断发展,移动设备能力不断提升,人工智能在移动环境中的应用更加广泛。目标检测是一项基础的计算机视觉任务,基于目标检测技术移动终端产生了丰富的智能应用,而移动环境也带给目标检测带来了数据难题和效率难题:(1)移动环境带来了更广泛的场景,但是也对模型精度提出了更高要求,这就对数据广度提出了更高的要求,不断扩充数据才能满足移动环境的需求;(2)移动环境中有更丰富的图像数据、更复杂的深度学
相位敏感光时域反射仪(phase-sensitive optical time domain reflectometer)简称Φ-OTDR,作为一种新型的分布式光纤传感技术,在许多信息检测领域中都有相当大的应用前景。在各种监测场所中,单纯的对光纤振动信号定位已经不能满足Φ-OTDR技术的要求,这就需要通过信号处理方法对振动信号类型进行正确识别。本文研究了Φ-OTDR分布式光纤传感系统的理论基础和传
进入新时代以来,我国经济迎来了高质量发展阶段,各行业对银行业的要求也日渐严格,为了迎合市场需要,国内银行需要提升自己的业务能力和竞争力,提升自身效率。现阶段,我国银行业相对西方发达国家仍然带有比较浓厚的政治色彩,提升银行活力也是国家之所急,而在众多激发金融业活力的策略中,以开放倒逼改革的思路似乎是国家近年来的重要思路,自2018年开始,我国集中出台了40多条对外扩大金融开放的措施,金融开放的步伐明
目前,我国的农村土地使用权流转主要是政府引导下的农民自发行为,形式比较多,程序比较乱,存在问题也比较突出,因此,急需政府科学引导。农村土地使用权流转问题也引起了党中央、国务院的高度重视,党的十八大、十九大以及乡村振兴战略、历年来的中央一号文件都对该问题进行了强调。农村土地使用权流转关系到农民的切身利益,且各地的情况不同,因此需要高度重视,及时发现存在的问题,分析原因,提出解决对策并付诸实施。泸州市