【摘 要】
:
人脸表情作为人类最重要的生物信号和情感信号,在人机交互、医疗诊断、机器人制造、侦查审讯等领域有重要的应用价值。近年来,由于深度学习技术的快速发展和视频数据海量增长,基于深度学习的视频表情识别算法成为表情识别任务的主流。现有的视频表情识别算法大都直接提取视频表情的时空特征,而没有考虑视频数据本身存在冗余的无表情和表情微弱的帧。这一问题严重影响了视频表情识别的性能和效率。因此,如何消除视频数据中的冗余
论文部分内容阅读
人脸表情作为人类最重要的生物信号和情感信号,在人机交互、医疗诊断、机器人制造、侦查审讯等领域有重要的应用价值。近年来,由于深度学习技术的快速发展和视频数据海量增长,基于深度学习的视频表情识别算法成为表情识别任务的主流。现有的视频表情识别算法大都直接提取视频表情的时空特征,而没有考虑视频数据本身存在冗余的无表情和表情微弱的帧。这一问题严重影响了视频表情识别的性能和效率。因此,如何消除视频数据中的冗余信息并提取丰富的情感表达,是一个极具挑战的任务。除此之外,人脸表情本身是一个复杂的过程,仅关注视频的视觉表征难以提取全面的情感特征,而融合音频等多模态信息有助于情感信息的相互补充。因此,如何有效的提取多模态特征并有效融合是视频表情识别领域的另一个重要问题。针对上述两个问题,本文首先提出了片段感知情感特征学习网络CEFLNet用以视频表情识别,然后在此基础上融合音频信息,构建增强的多标签多模态情感识别方法MEFLNet。本文的研究工作主要包括以下两个方面:(1)提出一种基于片段感知情感特征学习网络CEFLNet,用于视频表情识别。该网络可以有效地识别视频中每个短片段的表情强度,并获得片段感知的丰富情感特征信息。该网络首先构造了一个基于片段的特征编码器,其包含两个级联的自注意力和局部-全局关系学习,目标是对基于片段的时空特征进行编码。然后,以弱监督的方式构建情感强度激活网络,用于定位情感丰富片段并获取情感强度激活图,并提取丰富的情感特征表达。该方法在BU-3DFE、MMI、AFEW和DFEW这四个常用的表情数据集上分别取得了85.33%,91.0%,53.98%和65.35%的精度,均超过了目前最好的方法。(2)提出了增强的MEFLNet,用于多标签多模态情感识别。在CEFLNet的基础上,增加音频特征提取网络,并将音频特征与视觉特征进行多模态特征融合。首先,将音频进行分段,然后将音频数据特征转化为图像序列,并输入深度时空网络提取基于音频的情感时空特征。最后,将基于音频的情感特征与上述基于视觉的情感特征进行融合并分类。该方法在我们构建的多标签多模态情感数据上取得了比其他方法更好的结果,充分展示了提出的MEFLNet的有效性和融合多模态特征对表情识别精度的增益。
其他文献
我国课程改革坚持引入先进的教育理念,积极开展建立适合我国国情、适应时代发展的教育体系的研究与实践工作。学习进阶理论自2004年首次被发表,就一直是教育领域的研究热点。学习进阶围绕着核心概念展开,帮助学生在各学段的学习中持续加深对核心概念的理解。学习进阶的开发可以有效促进课程、教学和评价的融合。学习进阶理论的本土化,为我国课程改革提供了理论支撑,促进了教育观念的更新。按照学习进阶的研究范式,选择高中
作为公安系统的重要辅助力量和有力补充,警务辅助人员(以下简称辅警)在维护大局稳定、确保长治久安、保障经济发展、服务人民群众等方面的职能作用愈加凸显。但是囿于立法机制与各地现实状况等因素,目前仍没有系统完备的法律法规对辅警管理标准进行明确,统一的专门立法缺失,导致我国辅警队伍的法治化规范化建设进程阻力重重,在一定程度上限制其职能的有效发挥,同时极易引发管理实践中的矛盾和问题,具体表现为:辅警离职率高
混凝土材料具有抗压强度高等优点,是目前应用范围最广泛的建筑材料,其力学行为的研究是固体力学领域中极具挑战性的任务之一,引发了大量学者的广泛关注和研究。细观层次认为混凝土是一种由粗骨料、砂浆基质以及孔隙等组成的复合材料,普遍考虑混凝土宏观层次呈现的力学特性与各细观组分的形态、分布特征密切相关。但是一方面,建立细观特征与宏观力学性质之间的明确关系表达式极具挑战性;另一方面,细观力学研究通常需要大量真实
目的:通过计算机断层扫描(Computed Tomography,CT)冠状面观察到的内侧型小量丘脑出血(Medial Small Amount of Thalamic Hemorrhage,MSATH)(≤10m L)越过中线形似楔状,矢状面血肿堵塞中脑导水管,此类患者容易形成梗阻性脑积水且预后较差,进而定义“楔状征”;通过对出现“楔状征”的患者行保守治疗与微创手术治疗效果的对比,为临床医生更准
钢筋锈蚀是导致钢筋混凝土结构过早损坏甚至丧失承载能力的原因之一。使用FRP(Fiber Reinforced Polymer)筋替代钢筋,作为部分受力筋或全部受力筋用于混凝土结构中,是解决钢筋锈蚀导致钢筋混凝土结构损坏的途径之一。就目前而言,针对FRP筋混凝土结构的研究主要为梁和柱等构件的基本性能的研究,而针对FRP筋混凝土框架整体结构抗震性能的研究相对较少。本课题在FRP筋混凝土框架节点抗震性能
2021年6月2日,华为以线上发布会的形式召开全新HarmonyOS操作系统及全场景新品发布会,为全球消费者带来了自研的HarmonyOS 2以及多款硬件产品。笔者以此次发布会为素材进行了模拟交替传译,并在模拟口译结束后将自己的译文与现场专业译员的译文进行了对比分析。本报告从项目介绍、任务过程、案例分析以及任务总结等方面展开论述。笔者借助UMEER框架将口译过程中存在的不足归类为“理解、记忆、表达
心律失常分类在心脏病诊断中起着重要作用,目前有心电图(ECG)检测等常见的心律失常早期检测方法。若人工解释心电图信息不仅耗时耗力,而且需要具备专业的心电图学知识和丰富的心电疾病诊断经验,因此自动地检测心律失常显得十分重要。另外,卷积神经网络(CNN)是一种比传统方法更简单、更具噪声免疫性的多类心律失常自动分类算法。由于仅使用二维CNN没有对ECG导联关系有效考虑,且卷积核尺寸单一,导致准确率低,因
当前,农业土地规模利用是农业发展的必然趋势,是解决三农问题,实现“乡村振兴”的重要基础。土地是农业适度规模经营的载体,推动农业土地“三权分置”改革,建设农村土地流转市场是实现农业土地规模利用的重要途径,而“三权分置”改革成功的前提是农村土地承包经营权确权登记。农村土地承包经营权确权登记工作是一项完善农村基本经营制度、保护农民土地权益、促进现代农业发展、健全农村治理体系的重要农村改革工作。农村土地承
随着我国教育体制的改革和教学模式的转变,校园建设更趋于开放化和集约化,学校的教学方式也正从学生被动式的灌输向主动式的汲取进行转变。高校教学环境不再仅限于校园空间,同样校园环境也不再仅针对校内学生提供教育,高校与社会的互动将会随着时代的发展越来越频繁。而作为文化互动传播的重要组成部分——高校博览建筑也顺应校园开放化趋势,实现直接面向社会的运营模式,使用对象也从校内扩展到社会。使用者类型增加,使用行为
复式钢管混凝土结构较于传统的钢管混凝土结构来说,其稳定性和承载力均有了一定的提高,科研发展前景也比较广泛。但是,目前来说对复式钢管混凝土结构的研究还主要在柱的研究上,对复式钢管混凝土结构节点的研究比较少,在较大程度上影响了复式钢管混凝土节点的科学发展与应用。采用有限元软件ABAQUS对本文设计的节点-带加强环板的复式钢混凝土柱-钢梁节点提供仿真,以研究节点的抗震特性。论文主要内容与结论如下:(1)