面向表情识别的卷积神经网络研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:hyb916720hui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术的不断发展,人们的生活得到了很大的便利,人们逐渐对人机交互提出了新的要求,人们希望计算机能够识别人的情感状态,并依据目前人的情感状态提供更人性化的服务。表情作为人类情感最直观的表现,隐藏着很多重要的信息,充分利用这些信息,可以进一步提高人们的生活水平,因而具有巨大的应用价值。人脸表情识别是希望计算机能够准确识别人的表情,是人机情感交互中的基础,因此,如何让计算机准确识别人脸表情成为了很多研究者关注的重点。卷积神经网络作为深度学习中一种重要的算法,在很多计算机视觉领域都取得了很好的效果,因此基于卷积神经网络的人脸表情识别逐渐吸引了研究者们的关注。本文围绕基于卷积神经网络的人脸表情识别中卷积神经网络对表情图像的细微变化不够敏感、卷积神经网络不具有旋转不变性、融合卷积神经网络学习到的低层次特征与高层次特征进行表情识别时参数量过多三个问题展开研究,提出了相应的解决办法,本文的主要贡献如下:(1)针对目前卷积神经网络对人脸表情的细节变化不够敏感的问题,提出了卷积神经网络融合ROI(Region of Interest)概率分布的人脸表情识别的方法。首先,将图像划分成一系列ROI图像;然后,将ROI图像输入到卷积神经网络中进行训练,使卷积神经网络学习到表情图像的全局信息以及局部信息;最后,在测试时融合测试图像的ROI图像在Softmax分类器输出的类别概率分布,对其归一化后作为测试图像的类别概率分布,选取类别概率分布中最大值对应的类别作为测试图像的类别。实验表明,本文方法提高了卷积神经网络对表情变化的感知能力,比传统的基于卷积神经网络的人脸表情识别的准确率得到了显著提高。(2)针对卷积神经网络不能从训练图像中学习到图像的空间位置信息的问题,将STN(Spatial Transformer Network)网络引入到表情识别任务中。将STN网络放置在卷积神经网络的第一层,使STN网络能够随着卷积神经网络的损失值调整自身仿射变换参数,从而使卷积神经网络具有旋转不变性。实验表明,STN网络的引入能够使卷积神经网络具有旋转不变性,能够有效地提升表情识别准确率。(3)针对融合卷积神经网络学习到的低层次特征与高层次特征进行表情识别时参数过多的问题,提出了面向表情识别任务的双通道卷积卷积神经网络。将池化层池化得到的特征图分为上下两路进行卷积,上路特征图采用1×1卷积核对低层次特征图进行跨通道的信息整合,以得到低层次特征值,下路特征图输入到下一卷积层中学习高层次特征,将高层次特征与各层的低层次特征相融合后输入分类器进行分类。在多个表情数据集的实验结果表明,所提方法在保证识别精度的前提下有效地减少了特征融合后卷积神经网络的参数量。
其他文献
随着人类命运共同体趋势的不断发展,大学生国际意识教育已经成为我国思想政治教育的重要组成部分。国际意识教育能够培养大学生对国际形势的敏锐度,提高对国际事务的关注度,
大数据时代的到来,数据量急剧增长,各行各业都面临着海量数据信息,越来越多的公司正“淹没”在海量数据中,如何从中挖掘有效信息已成为研究热点。粗糙集理论能够有效地处理复杂系统中的数据信息,已成为处理不精确、不确定性问题的数学工具。其最大优势在于不需要任何先验知识就可以对数据进行处理,寻找最优信息,既保持了知识分类能力不变,又能对数据进行冗余处理(属性约简),最终获取有效信息。全粒度粗糙集作为一种新型粗
非线性系统反馈镇定是自动控制理论的研究热点之一,广泛应用在各种国防和工业控制问题上,如挠性卫星的变结构姿态、机器人运动,汽车GDI发动机轨压,欠驱动吊车的高性能防摆定位等.在实际系统研究中,非线性系统比线性系统不但精确可靠,而且研究更加复杂.然而,实际系统总会受到模型误差、外部干扰、随机噪声、测量误差等不确定因素的影响.因此,研究输出反馈镇定不确定非线性系统具有重要的理论意义和实际应用价值.本文基
随着资源紧缺和环保问题的日益严峻,世界各大汽车厂商纷纷开始对深度混合动力汽车进行研究。镍氢电池组(Ni-MH)作为一种深度混合动力汽车用新型储能元件,其性能优劣与使用寿命对整车的性能和生产成本都有重要影响。随着电池的充放电,Ni-MH电池中会累积大量的热量,受车载空间和时间的限制,如果不能有效地将电池组散热,设计出合理的热管理系统,会导致电池组内温度过高和各处温度的不一致,影响电池组的性能及其使用
随着汽车普及程度的提高,城市中的拥堵现象越来越严重,出行路径选择越来越受到人们的关注。近年来,一方面,网络技术发展迅速,使得各方面的数据的获取要容易很多;另一方面,数据挖掘技术的兴起带来了数据研究的热潮。基于以上阐述,本文利用出租车的轨迹数据进行城市交通小区之间的路径选择问题的相关研究,取得了如下研究成果:1)基于上海市出租车轨迹数据的交通小区之间路径规划算法实现。主要针对选取的出租车轨迹数据进行
机器视觉系统的首要任务是针对目标物进行测量、判断,以使系统能够达到识别目标物并进行定位和跟踪的目的,其中,图像识别是助力机器视觉系统完成识别与定位任务的一类重要基
思想政治教育是我国高校教育的重要组成部分。高校思想政治教育亲和力是提高高校思想政治教育实效性的重要因素。探究高校思想政治教育亲和力的提升路径,是解决目前我国高校
时间延迟估计与波达方向估计是信号处理领域关于目标定位技术的两个重要研究内容。在实际应用场景中,由于信道传播与接收机周围环境存在复杂性和多样性,使得信源信号与接收机
LoRa中基于纯Aloha协议调度站点在共享信道中的随机接入,其吞吐量最高只能达到18.6%,当负载超过0.5并继续增大时,其吞吐量会急剧下降。而基于时分的DQ协议,不仅能将同时接入
随着工业和技术的飞速发展,气体传感器广泛应用于人工智能、环境监测、医疗设备等领域。因此,探求一种高性能、低功耗、低成本的气体传感器具有重要意义。本文中,我们采用水热法结合化学沉淀法制备了MoS_2、PbS@MoS_2、PbS@WS_2等材料,并对其晶体结构、微观形貌、材料组分和表面化学态进行了表征。制作了气体传感器以研究气体传感器的敏感机制。主要研究内容如下:1.通过水热法合成了MoS_2纳米花,