基于度量学习和注意力机制的情感识别算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:shushuclover1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,中国的老龄化问题日益严峻,给政府带来了沉重的财政负担。老年人随着年龄的升高,极容易产生孤独、苦闷、失落等不良情绪。试想如果有一款家庭服务机器人能够精准的识别人类的情感,就可以做到与老年人进行情感交互,帮助老年人对抗社交孤立、消除孤独感,从而提高老年人的心理健康程度,缓解社会负担。另外,具备情感识别功能的机器人在智能安全驾驶、医疗康复、学校教育、罪犯心理分析以及市场销售等领域也有着广阔的应用场景,因此开发一款具有情感识别功能的机器人是一件非常有意义的事情。近年来,深度学习技术快速发展,在众多领域取得了令人满意的效果,基于深度学习的识别技术也因此成为了情感识别研究领域的主流方法。本文以深度学习技术作为基础,针对当前情感识别技术种存在的问题,提出了基于度量学习与注意力机制的解决方案,主要研究成果如下:(1)针对人类个体属性、光照强度等因素导致模型提取出的表情特征出现类间差异度小、类内差异度大的问题,提出了一种联合局部图像和深度度量学习的表情识别算法。首先,基于人脸的landmarks检测出和表情最相关的活动单元组成局部图像进行提取特征,构建的局部图像能够明显减少环境变化及人类个体属性差异带来的噪声,减少计算量。其次,提出了一种表情度量损失函数,该函数能够明显地增大表情的类间距离,减小类内距离。最后,通过联合优化分类损失和度量损失提升了模型识别的精确度。经实验验证所构建的模型在三个流行表情数据集上的结果都超越了当前最先进的方法,并通过对模型提取出的特征进行可视化,验证了所提出的表情度量损失函数的有效性。(2)第一部分的工作经过进一步研究发现存在以下问题:一是当输入图像比较复杂时,获取到的landmarks置信度不够高,致使得到的局部图像具有很弱的代表性;二是标记landmarks的成本比较大;三是上述模型没有像人类那样综合考虑人脸的一些局部信息进行表情识别。针对上述缺点,提出了一种基于视觉自注意力网络的表情识别模型,此模型旨在综合考虑人脸的局部信息进行表情识别。首先,基于数据增强技术构建不同环境干扰下的局部图像。其次,为了把局部图像的鲁棒性特征进行融合,通过对Transformer模型进行改造,构成了一种视觉自注意力网络,其能够考虑到局部图像之间的相互影响,使表情特征有更加判别性的表达。最后,经实验验证所构建的模型在五个流行表情数据集上的识别率都能达到或超越当前最先进的方法,较好的说明了模型的性能。(3)前两部分方法仅是依据人类的表情识别情感,这种单模态的研究方法存在以下问题:一是由于人类的情感复杂,仅从单一模态进行识别,不足以说明人类的真实情感;二是单模态的研究中会存在各自的问题,如面部表情容易受到光照强度、遮挡等因素的影响,语音信号容易受到各种噪声的影响。如果利用多模态信息进行研究,会起到各种模态信息互补的作用,提升识别的准确率。因此,在这一部分中本文基于所参加的情感识别比赛探究了另一种模态(文本)的情感识别算法,并对图像和文字两种模态做了融合。具体地,提出了一种基于Bert模型的情感分类算法,结合基于注意力机制构建的动态融合策略、度量学习、多模态融合与模型集成方法,在情感识别分类比赛中取得了较好的名次。(4)在上述理论方法的基础上,为了使算法实际落地,不仅从软件和硬件两个层次对上述提出的模型进行了轻量化处理,且进行了系统实现。软件方面使用网络结构优化技术与模型剪枝方法对模型进行了压缩和加速,硬件方面使用Jetson Xavier NX提升了模型的推理速度。通过以上方法可明显缩减模型的参数量和计算量,有效的提高模型的识别速度,提升算法的实用性。
其他文献
通过物理或化学变化进行生产的行业被称为流程工业。近年来,流程工业正向智能优化制造方向发展。流程工业生产制造过程具有强实时性,企业在不断发展的过程中,生产制造点也在不断的增加,导致流程工业生产过程中的数据成倍增加。由于各企业间没有建立统一的数据标准,存在大量实时数据出现异构问题。产品从原料获取、生产、使用直到废弃这一过程称为产品的全生命周期,对流程工业全生命周期的数据进行集成是本文研究的重点之一。目
学位
硝酮是一类生物和医学上重要且应用广泛的化合物,具有抗氧化、抗增殖、抗炎、抗菌的作用。目前,对于一些结构相对简单的硝酮化合物的合成已有相关文献报道,然而,对于多官能团化的硝酮化合物的制备,目前已报道的文献中存在一些明显的问题以及合成方法的局限性。因此,开发简便、高效的合成多官能团化的硝酮化合物的新方法是当前迫切需要解决的问题。α-卤代腙属于一类合成功能广泛且功能强大的合成子,可参与许多化学转化。基于
学位
近年来深度学习在许多领域都取得了优异的表现,如计算机视觉、推荐系统、自然语言处理等。尽管深度学习在应用上取得了极具价值的成果,但是它的理论仍然存在一些重要的问题尚未解决。其中,神经网络的表达能力(Expressive Power),作为深度学习理论的重要组成部分,对我们理解深度学习起到了至关重要的作用。从函数逼近(Function Approximation)的角度看,神经网络的表达能力描述了神经
学位
小麦白粉病是我国常见的,多发的,对农作物危害较大的病害之一,严重影响小麦产量,造成经济财产的损失,危害粮食安全。为了对小麦白粉病害实现早发现,早防治,减少其对作物及经济的损害,需要对显微图像中的孢子进行识别,进而进行病情分析。小麦白粉病孢子显微图像从田间采集,往往带有许多其他病害孢子及尘土杂物,背景干扰物较多,传统的孢子识别技术对于干扰物较多,杂物颜色形状与目标近似的图像效果并不理想,对目标孢子的
学位
随着国民经济和消费水平的快速发展,我国汽车行业开始从销售转向服务,汽车产销企业面临巨大的机遇和挑战。随着互联网经济、大数据时代的到来,建立品牌价值,打造良好口碑,为用户端提供更优质的服务,是各车企追逐的目标,更是“汽车服务集团”业务转型、服务升级、经营思变的唯一出路。作为主机厂的A公司,在如此形势下,依托互联网平台的建设,通过汽车出行服务业务运营策略的应用,助力车辆营销,赋能经销商服务转型,提升车
学位
高强度铝合金复杂空间曲面壁板焊缝质量是保证航天、航空大型结构服役性能的关键。搅拌摩擦焊技术是实现高强铝合金复杂空间曲面壁板结构焊接的理想技术。近年,随着人工智能技术的发展,智能制造已成为当前时代的趋势。机器人技术是提高铝合金壁板的焊接效率与焊接智能化的有效手段。但是串联机器人存在末端刚度差的缺点将会限制其在搅拌摩擦焊任务中的性能。因此,本文以提高串联机器人末端刚度为目的开展了运动学建模、指标构建、
学位
光和物质相互作用一直都是量子光学中重要的研究内容之一,描述单模量子光场与量子比特(二能级量子系统)相互作用的量子拉比模型是量子光学和量子信息研究中最重要的基本物理模型之一,强耦合条件下的JC模型(Jaynes-Cummings model)在量子态相干操纵和量子信息相关研究中得到广泛应用。在目前的研究中,根据光和物质之间的耦合强度的不同,对量子拉比模型相关问题的研究分成弱耦合、强耦合、超强耦合和深
学位
一直以来,各国经济发展过程中均面临着地区间经济增长不平衡与不协调的困境,如何缩小区域间经济增长的差距是经济学领域研究的热点问题。习总书记在党的十九大报告中明确强调区域间经济增长与发展不平衡问题的解决,不仅关乎我国经济体系现代化建设的全局,也关乎我国社会的稳定和国家的长治久安。经济增长收敛性主要研究各地区间经济增长的差距及造成差距背后的原因,在经济学领域的研究中占据重要地位。山西省位于中部地区,是中
学位
抑郁症是一种心理障碍,对健康造成负面影响。虽然抑郁症可以被诊断并有效治疗,但是依旧存在大量抑郁症患者因没有受到专业诊断而未被治愈。医疗费用的负担、抑郁病情的隐瞒等问题都阻碍了患者获得摆脱心理疾病的机会。随着社交网络的不断发展,微博平台吸引着越来越多的用户表达与分享自己在生活中的情绪。作为人们主动表达情绪的社交软件之一,微博的内容更加真实可靠,也为大家了解抑郁患者的情感状态和心理活动提供一种有效的渠
学位
数字微流控技术是一类先进的液滴操纵技术,可通过多种驱动原理实现微液滴操控。其中基于介电润湿效应的数字微流控技术发展尤为迅速,该技术不依赖泵、阀等器件即可实现微液滴操控,具有试剂消耗小、自动化程度高、与传统检测技术兼容性好等优点。但传统介电润湿芯片存在制备工艺复杂、加工难度大、成本高、可复用性差等问题;此外,相应的介电润湿芯片驱动系统硬件结构复杂且控制困难,阻碍了该技术在检测领域的应用和推广。针对上
学位