数据驱动与知识引导相结合的视频情感计算

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:feboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学的不断发展,以及对个性化人机交互需求的不断增强,情感计算在人机交互中的重要性日益显著。传统的人机交互,主要通过键盘、鼠标、屏幕等方式进行,只追求便利和准确,无法理解和适应人的情感或心境。而人们的感受对决策有直接影响,情感能力对于计算机与人的自然交往至关重要,所以情感计算具有重要意义。视频数据的骤增为情感计算带来了新的机遇和挑战,数据驱动的视频情感计算,主要是通过移动互联网采集海量的数据,在采集数据的基础上经过训练和拟合形成自动化的决策模型,相关研究方法颇丰,但数据驱动的方法过度依赖训练样本,在实际应用中很难推广,性能也差强人意。知识引导的视频情感计算可以作为数据驱动的视觉识别方法的有效补充,为解决无监督视频情感计算和情感鸿沟等问题提供新的思路。因此,本文不仅研究了视频数据驱动的情感计算方法,还将外部知识引入到了视频情感计算方法中。近年来,随着机器学习等技术的飞速发展,涌现出多种有效的视频情感计算模型,这些模型的核心问题之一,是如何学习出能够代表视频主观情感的表示向量。然而,视频数据具有多模态、域差异的特性,视频底层视觉内容和观者情感之间存在情感鸿沟,情感理论动态发展导致细粒度的情感标签不断增加,这些都为视频情感计算带来了挑战,为了解决这些挑战,本文研究了视频情感表示学习及其应用。本文主要工作如下:(1)针对视频数据的多模态特性和域差异特性,研究了一种情感表示学习的多模态域适应框架:首次提出解决多模态和域适应特点的统一框架,不仅可以应用在视频情感表示学习,也适用于其他多模态域适应的任务,比如跨域跨模态检索;为了挖掘不同模态的互补性,提出了一种协变多模态注意力模块,不仅学到各个模态特征中最有助于模态融合的显著部分,而且还包含结构敏感组合机制,能够捕捉各模态的全局结构信息;提出了混合域联合约束,将对抗损失函数分别约束在源域和目标域的原始模态特征,注意力加权后的特征以及融合后的特征,以此来学习判别性和域自适应的多模态视频情感表示。最后在视频人物情感识别的任务中,验证了多模态域适应框架的有效性。(2)由于视频样本标注耗时耗力,缺少大规模训练数据集,在缺乏观者生理信号的情况下,为了弥合情感鸿沟,提出了一种新型的知识引导的情感表示学习:首次将外部情感知识图谱引入到视频任务上,以视频中的视觉目标和情感概念为节点,用大型外部知识图谱Concept Net和Sentic Net抽取对应关系,建立了视觉情感知识图谱;采用双胞胎图卷积神经网络学习到了知识引导的视频情感表示。最后将知识引导的视频情感表示应用到视频精彩片段检测任务上,在两个标准视频精彩片段数据集上评估了学习到的视频情感表示。广泛的实验结果证明了知识引导的情感表征学习的鲁棒性。(3)为了适应情感理论动态发展所带来的细粒度情感类别不断增加的问题,研究了零样本视频情感表示学习:首次定义和研究了视频情感零样本学习任务,能够识别出没有训练样本的罕见情感类别。首先通过外部知识辅助的动态上下文情感,为了建模主角的时序信息和上下文信息,采用视频transformer来建模视频情感表示;为了更好地使视频表示与未知情感标签保持一致,通过噪声对比估计目标函数学习得到多模态的情感嵌入空间。通过在三个数据集上的观者情感零样本识别实验,验证了我们提出的上下文可知的视频情感表示的鲁棒性。
其他文献
为实现污水管网全覆盖、全收集、全处理目标,全国各地区陆续开展排水管网排查与整治项目。以“长江大保护”为代表的污水提质增效项目指出,在全面开展排查修复工作之前,应对管网进行预诊断。针对这一问题,提出了基于外来水量分析的诊断方法,介绍了外来水量预诊断的目的、意义、诊断内容及技术路线,并综合运用水量平衡法、基于化学质量平衡法和基于流量测量的方法对“长江大保护”项目中的南方某城市排污管网进行了诊断。诊断结
目的分析20082011年濮阳市狂犬病暴露人员的基本特征、处置效果,为更好地预防控制狂犬病提供依据。方法收集并分析市疾控中心犬伤处置门诊收集的暴露人员的基本情况、受伤害时间、部位、伤害程度、伤口处理、伤人动物种类与动物免疫状况、狂犬疫苗以及被动免疫制品使用情况等。结果濮阳市犬伤处置门诊2008年1月1日2011年12月31日共收集6 531名受动物伤害者,暴露人员男女之比为1.41︰1,10岁以下
近年来,随着市场对产品质量要求的提高,传感器、工业总线等技术不断进步,使得产品自动视觉检测所需处理的数据量越来越大,对视觉检测方法的处理速度要求也越来越高。视觉检测方法的研究通常涉及图像特征提取算法的开发,特征提取是实现目标检测、缺陷识别、形貌测量和三维重建等任务的关键预处理步骤,其作为视觉检测中最耗时的环节,极大地影响了系统的检测效率。本文针对视觉检测系统中限制检测速度的关键特征提取算法,研究F
钨及钨基复合材料因具有耐高温、高强度以及低溅射率等优良性能在热核聚变面向等离子体部件材料中受到高度重视,如用钨作为第一壁材料,W-Cu作为连接材料等。上述应用中,对材料的热性能提出了很高的要求。利用金刚石(Diamond,简称D)优异的导热性能制备金刚石/铜基、银基复合材料已获得了成功应用。但是金刚石的热稳定性存在一定的不足,在面向等离子体部件应用的钨及钨基材料中引入金刚石的可行性,及其对材料的组
本实用新型涉及一种塑料吹瓶机出料装置,涉及吹瓶机设备领域,包括塑料吹瓶机本体,塑料吹瓶机本体设有出料口,出料口处设有接料台,出料口上沿设有垂直向下设置的防静电帘,接料台下方设有接料箱,接料箱一侧还设有废品箱,接料台上设有次品分流组件分别连通废品箱和接料箱,
期刊
随着航空航天技术的发展及现代光学系统性能的不断突破,对光学材料双折射的实时在线测量成为新的研究热点。光纤中具有丰富的双折射变化,其双折射测量对提高光纤系统的整体性能至关重要。激光频率分裂双折射测量技术可对多种双折射以及其他外部参数进行测量。传统的激光频率分裂双折射测量技术多基于氦氖激光器,对待测对象透射率有极高要求,限制了可测的样品范围;且难于与光纤等波导系统进行耦合。本论文针对基于光纤激光频率分
大规模MIMO(Massive Multi-Input Multi-Output,Massive MIMO)系统通过在基站部署数以百计的天线,可以显著地改善无线通信系统的传输速率及其可靠性,为更多用户或设备提供优质的通信服务。然而,通信系统中庞大的天线阵列导致了预编码算法具有极高的运算复杂度,从而影响通信系统的传输效率。而且,传统预编码算法要求系统的每根天线都对应一条射频链路,这将导致部署大规模M
钨材料被认为是优秀的核聚变发生装置中的面向等离子体材料。但是,由于钨的脆性和低韧性,导致其在使用过程中经常快速断裂失效,这极大限制了其在实际工程中的应用。针对这一问题,本文以钛箔和钽箔作为增韧层,利用放电等离子体连接技术设计制备了一系列不同的钨层状复合材料。通过研究层状复合材料中的元素扩散行为、微观组织和界面结构特点,分析了复合材料的微观组织形成机理及其与力学性能之间的对应关系,在此基础上阐明了复
洪涝数值模型是当前城市内涝风险分析和预报预警的主要技术手段,然而数值模型的计算速度较慢,难以满足日常防汛应急的需求。如何将人工智能技术,引入到训练样本及标注数据较少的城市积水内涝快速预测中,是个重点关注且亟待解决的问题。针对这个问题,本文将具有良好计算精度数值模型与具有较高计算效率的BP人工神经网络模型相结合,提出了一种快速预测城市内涝风险的新方法。本方法以城市洪涝模型的模拟结果作为数据驱动,构建
随着通信和信息领域的快速发展,高速、大容量、高数据信息传输已成为必然趋势。然而,现有的通信技术还不能满足这些要求。近年来,人们提出了一种携带轨道角动量(OAM)的涡旋光束,由于它具有正交特性,因此可以用于提高通信容量和信息数据率。但基于OAM的自由空间光(FSO)通信链路传输面临着大气湍流(AT)这一严峻挑战,因为它会引入多模态串扰,从而降低了通信系统的性能。本文的主要目的是提出一些解决方案,用来