基于深度卷积神经网络的人脸表情识别研究

被引量 : 0次 | 上传用户:wgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
察言观色,虑以下人。面部表情是人类传达情感状态和意图最直接、最自然的外部表现之一,人脸表情识别(FER)技术旨在研究如何自动、可靠、高效的获取并利用人脸表情所传达的信息,进而快速准确地推测出人们的情感意图,在人机交互、安防监控、虚拟现实和医疗诊断等诸多领域有着广泛应用。FER技术的关键是如何有效提取人脸表情特征,传统的机器学习往往采用手工的特征设计方法,这需要大量的先验知识,且会导致主观性。随着深度学习的迅猛发展,利用卷积神经网络进行特征学习提取更深层次、更抽象的语义表征取得了长足进步。然而,自然场景下的人脸表情图像往往受到非表情因素的干扰(例如面部姿态、光照和遮挡等),这些不可控因素严重影响了人脸表情的识别精度。此外,某一静态的人脸表情图像往往具有复杂的情感意图,而单标签的人脸表情数据集无法有效描述复杂情感倾向会导致歧义表情的问题。目前主流的深度人脸表情识别模型通常含有巨大的参数量,其高昂的计算开销在实际自然场景中也是难以被接受的,因此FER任务除了在继续提高识别精度的同时,也应考虑如何压缩模型的计算开销。针对以上这些问题,本文在学习研究了人脸表情识别相关的基础理论以及三种现代卷积神经网络算法的基础上,完成了以下具体工作:1.提出了一种基于改进残差网络的人脸表情识别算法(MSP-ACB),目的是减少池化过程中的主观性以及增强卷积核的性能。通过构建多尺度重要性池化与非对称卷积块,不仅能增强模型对局部细节特征的提取能力,而且在下采样时可以自适应地学习和保留全局重要性特征。具体地,在卷积层,通过将非对称卷积核组进行融合,然后将融合后的非对称卷积块来初始化原始网络,融合后的卷积核参数具有更强特征提取能力,以此增强图像主轴位置的权重,这有利于模型对人脸表情图像重要局部位置的特征提取;通过从局部重要性的角度提出了多尺度重要性池化来进行特征压缩,多尺度自适应地学习对输入全局特征的重要性权重,从而保留具有鉴别性的特征,这避免了先验知识的主观性,并研究分析了放大系数对不同数据集的影响。MSP-ACB方法在人脸表情数据集RAF-DB和FER2013上进行了实验验证与分析,分别达到了85.53%和72.72%的识别准确率,相较于原始骨干网络以及近期相关方法,其识别准确率均有一定提升,并通过消融实验验证了MSP-ACB方法中各模块的有效性。2.研究了空间分组增强注意力的轻量级人脸表情识别算法(SPFER),该方法不仅可以提高自然环境下人脸表情的识别准确率还可以优化模型的参数量。具体来说:在浅层网络,设计了并行的深度卷积残差结构,并结合Re LU6激活函数减少冗余度,以增强模型对面部表情局部细节的表征能力,并将局部特征与全局整体特征相融合;在深层网络,建立了空间分组增强注意力机制,以解决表情图像噪声导致的特征空间分布不稳定问题,突出语义特征的重点区域,增强深层网络对表情图像的细粒度学习;为了避免模型过拟合,提高模型泛化能力,在不大量增加计算复杂度的前提下,将改进后的深度可分离卷积作为主干网络的输出。SPFER方法在人脸表情数据集RAF-DB、Affect Net-7以及Affect Net-8上分别达到了88.33%、63.09%和60.12%的识别准确率,相较于近期人脸表情识别方法具有较高的识别准确率,同时模型参数量为16M,这相较于原始骨干网络压缩了20%。3.研究了权重推断与标签平滑的轻量级人脸表情识别算法(Light-Weight FER),该方法在保持较低计算复杂度的前提下,仍具有较高的识别性能。具体来说:从特征提取的角度,通过对原始网络的分析与剪裁,得到了改进后更精简高效的网络模型,这不仅进一步压缩了模型的计算复杂度,而且还提高了模型的表征能力;为了增强模型对人脸表情图像局部细节特征的提取能力,抑制非表情特征,在模型中嵌入了基于最大池化的通道空间关键权重推断模块,且这一模块具有较小的计算开销。从训练策略的角度,通过标签平滑学习方法,在不引入额外信息的前提下,利用软标签分布监督网络的学习,以减少由于歧义表情对识别性能所带来的不利影响。Light-Weight FER方法在人脸表情数据集RAF-DB、Affect Net-7以及Affect Net-8上分别达到了86.91%、61.80%和58.75%的识别准确率,在参数量仅为0.95M的受限条件下,仍具有较好的识别性能。
其他文献
边缘计算是一种能够支持时延敏感型应用需求的新型网络计算解决方案。然而,由于用户移动的高度动态性与不稳定性,动态服务迁移问题成为边缘计算系统中的一个重要挑战。由此,本文针对动态服务迁移策略设计展开研究。首先,本文定义并形式化建模多用户动态服务迁移问题,优化目标是最小化系统长期服务延迟,包括累计用户计算延迟、通信延迟与迁移延迟。然而,该问题存在网络环境复杂、用户移动频繁且具有不确定性、用户数量多导致的
学位
随着信息与通信技术(ICT,Information and Communication Technology)的飞速发展,无线网络在满足用户业务量爆炸式增长的同时,其消耗的能量也在急速增长。过高的基站能耗开销不仅对生态环境带来负面影响,也带来了运营成本的提高。基站能源消耗受制于网络中基站部署和控制的灵活性。近年来绿色节能通信技术得到了广泛而深入的研究,高能效基站控制技术作为提高网络能量效率的重要手
学位
目的:从循证医学角度探讨绝经后骨质疏松(POP)患者序贯治疗后应用地舒单抗对骨密度和骨标志物的影响。方法:全面检索万方数据库、维普数据库、中国知网、中国生物医学文献数据库、PubMed、Embase和the Cochrane Library,对已发表的地舒单抗用于POP序贯治疗的文献进行筛选评估,纳入研究进行质量评估,借助RevMan 5.3软件对疗效和安全性进行分析。结果:最终纳入7篇文献,共1
期刊
<正>骨质疏松是一种以骨量降低、骨组织微结构受损、骨脆性增加、易发生骨折为特征的全身性骨病[1],是老年常见的慢性病之一。美国、加拿大和韩国50岁以上的男性和女性骨质疏松的患病率分别为5.1%和16.5%、6.6%和15.8%、7.3%和38.0%,我国50岁以上的男性和女性骨质疏松的患病率为6.0%和32.1%,65岁以上人群骨质疏松患病率为32.0%,其中男性为10.7%,女性为51.6%[2
期刊
联合用药是提高抗肿瘤治疗效果和克服肿瘤耐药的重要临床措施。与联合用药相比,多靶点药物在发挥类似活性的同时,还能有效避免不良的药物-药物相互作用和提高病人依从性,因此是药物化学研究领域的热点之一。肿瘤的侵袭和转移是恶性肿瘤难以被治愈的原因之一,许多研究表明氨肽酶N(Aminopeptidase N,APN)可以降解细胞外基质(extracellular matrix,ECM)进而促进肿瘤转移。此外,
学位
随着智能制造技术的快速发展,以机器人为核心的柔性喷涂生产线,因其具有高效灵活、环保安全等优点,在工业领域得到广泛应用。然而,传统专注于大规模集中制造的固定流程作业模式,已经难以满足日益增长的以小批量、多品种为特点的定制化喷涂需求。为实现灵活柔性化作业,大型喷涂企业常采用三维视觉感知技术获取工件形貌特征,实现在线工件识别和喷涂路径规划。然而,高昂的成像设备及技术成本让诸多中小企业望而却步。为降低机器
学位
骨质疏松症困扰着全球2亿患者,随着全球人口老龄化的加剧,骨质疏松发病率将不断增加,预防骨质疏松成为公共卫生领域亟待解决的问题。本文分析了乳制品基质、矿物质、维生素、乳蛋白、乳脂和乳糖调节肠道菌群对钙吸收和骨骼健康的作用机制,综述了强化添加VD、益生元和益生菌的乳制品对不同人群的干预效果及降低骨质疏松风险的研究进展,比较了乳制品与植物基替代品的干预功效,为乳制品精准干预改善骨骼健康提供科学参考。
期刊
随着人工智能技术和网联技术的飞速发展,目前已有大量具有辅助驾驶功能的智能汽车投入生产使用,有条件自动化和高度自动化的智能汽车也在部分城市开始试点运行。尽管研发智能汽车可以减缓道路交通压力,减少交通事故发生的几率,但由于技术的发展限制,它们仍然无法保证行驶中的绝对安全,而且多次发生的交通事故也印证了这一点。我国目前有关智能汽车的规范性文件偏重于试验性和行政指导性,不具有普遍适用的法律效力。国家层面未
学位
<正>骨质疏松性骨折在临床上是发病率极高的一种骨类病症,具体病因是骨量低、骨组织微结构损坏,导致骨脆性增加,患者受到轻微创伤或仅仅是从事日常活动,就可能发生骨折的全身性骨病。这一疾病严重危害患者的生命健康及生活质量,严重时甚至有可能造成偏瘫或者死亡。由于现代人,尤其是中老年人(绝经后女性和老年男性)发生骨质疏松的可能性很高,而且老年人群对骨质疏松症的危险因素、预防措施等知识的知晓率较低,因此相关人
期刊
氯酚类有机物是重要的有机化工原料,长期以来的大量使用,使得其通过各种途径进入到水体环境,广泛存在于废水、地表水和地下水中,造成水污染。2,4-二氯苯酚(2,4-DCP)作为典型的氯酚类有机物之一,已被频繁的在水体中检测到,且其较强的毒性严重威胁到人类的健康安全。然而,传统的水处理技术难以使其被有效降解。基于过硫酸盐的高级氧化工艺(AOPs)由于具有氧化能力强,非选择性降解以及适用的环境pH范围广等
学位