基于深度卷积神经网络的面部表情识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:biti_wxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情是人们表达情感的重要途径,近年来随着计算机领域的发展,面部表情识别成为了当前的研究热点并取得了显著的进展,可应用于人机交互、情感计算等计算机视觉领域,人工智能和深度学习的发展则更好地促进了面部表情识别的研究。基于机器学习的传统面部表情识别算法采用人工的方式进行特征提取,所提取的面部表情特征存在人为因素的干扰,以至于训练完成的分类器不能有效地解释表情信息,最终导致模型泛化能力不足,识别准确率较低。深度学习算法中的卷积神经网络在面部表情识别任务中的优异性能表现吸引了众多研究学者的目光。但是现实场景中的基于深度学习的面部表情识别仍然受到人体姿势、面部不同程度的遮挡、背景环境与光线干扰等因素的影响,识别的准确率仍需进一步提高,因此本文提出一种改进的基于深度卷积神经网络的面部表情识别模型,用来提高面部表情识别的精度。具体工作和创新点如下:(1)针对传统面部表情识别模型准确率较低的问题,本文提出了两个改进的卷积神经网络模型用于对比选择。第一个模型是针对面部表情识别任务进行优化改进的VGG12网络,VGG12网络结构基于VGGNet,改变了其系统结构并添加了Dropout避免过拟合;第二个模型是基于深度可分离卷积的深度卷积神经网络(DCNN),DCNN的结构参考了VGG12中卷积块的叠加,但将其核心的卷积层替换成了深度可分离卷积层,同时搭配卷积残差块的使用,使网络能够有效减少参数的情况下,能够提取多尺度上的特征信息,从而有效的保留了细节特征。通过实验发现DCNN不仅拥有更少的参数数量,而且准确率也略高于VGG12,因此,本文选择基于深度可分离卷积的DCNN作为基础特征提取网络。(2)卷积神经网络的输入数据中缺乏多样性和易于分辨的特征信息可能会影响网络的性能,导致面部表情特征提取不足,为了解决以上问题,可以在网络中引入注意力机制使其忽略图片中无关特征而专注于有效特征。因此,在DCNN模型的基础上添加了卷积块注意力模块构成了新的DCNN-CBAM网络,使网络可以依次沿着通道和空间两个维度对给定的输入特征映射计算注意力图,然后再将输入的特征映射与其注意力图相结合以完成特征的精细化从而提高网络模型的特征表达能力。在不同数据集上的实验结果表明,在DCNN网络中引入注意力机制,可以有效地提高网络的性能和识别的准确率。(3)针对Re LU激活函数会在网络训练过程中产生负值神经元坏死,以及传统的Softmax损失函数无法解决在面部表情中训练数据存在同类表情差异较大,不同类别的表情差异较小的情况,在DCNN-CBAM网络中引入了Mish激活函数和AM-Softmax损失函数。Mish激活函数可以避免神经元坏死的情况,而AM-Softmax损失函数则可以最大化类间差异,实验证明,引入Mish激活函数和AM-Softmax损失函数可以改善DCNN-CBAM的训练情况,使其具有更好的特征表达能力。
其他文献
随着互联网的发展和普及,各个应用产生的信息量正快速膨胀,在海量数据中,用户可以享受到丰富的信息,但庞大的数据规模使其难以选择自己需要的内容,会存在着“信息过载”的问题。推荐系统可以极大缓解此类问题,它不仅可以满足用户对高质量信息的需求,而且可以为企业增加对用户的吸引力并巩固自身在行业内的地位。近年来,深度学习的出现解决了传统推荐系统的特征学习和高阶特征交互问题,充分挖掘不同特征域之间的高阶特征交互
学位
三维场景重建是计算机视觉中的一个重要研究方向。然而,静态三维重建不能很好的直观风车等运动情况,常规动态三维重建需要的户外作业和成本较高,其中大多数的重建工作都是通过特定的现场无人机视频流,或者是卫星图像、深度图像,又或者是Kinect、Li DAR(激光雷达)等获得的点云数据来进行三维重建。其中包括通过多视角图像提取特征点,对多视图中的特征点进行匹配,构建基础矩阵等恢复相机参数,从而得到场景的三维
学位
低频机械能的收集技术是国内外学者的重要研究方向之一,尤其近年来大量低功耗小型电子设备在人们的生活中扮演着重要的角色,它们分布范围广且数量庞大。在人们的日常生活中会源源不断的产生低频机械能量,通过摩擦纳米发电机将低频机械能进行收集并转化为电能,为这些电子器件的自供电提供了新的探索道路。本文通过对品质因数的理论分析,设计了一种基于提升低频输出的按压式摩擦纳米发电机,利用杠杆原理在低输入力下对发电部位进
学位
功率铁氧体磁芯具有磁导率高、电阻率高和成本低的优点,是开关变换器中功率磁性元件常用的磁芯材料。开关变换器磁性元件通常工作在非正弦激励条件下,厂家给出的正弦激励损耗数据不能直接应用。随着小型化的需求,不断提高的开关频率导致磁芯损耗建模和预测变得越来越重要,磁性元件过热是开关变换器失效的主要原因之一。本文首先分析了功率铁氧体磁芯损耗构成分量:磁滞损耗、涡流损耗和剩余损耗,并分别介绍了其产生的物理机理。
学位
本文探讨了运营商中国联通江苏省分公司在互联网化环境下实体门店的困境以及寻求变革的方法尝试。通过O域数据分析、位置信息测算、线上运营与线下实体门店结合、产品与触点协同和互联网社交能力的应用来实现精准点对点邀约的系统化工具,即基于新零售C2B架构的互联网+营业厅协同管理系统(以下简称为“炒店系统”)。炒店系统实现了基于位置的场景化营销,实时监测营业厅实体门店经纬度周边范围内的流动用户和常驻用户,进行实
学位
储能系统因其控制灵活、响应迅速等特点常参与电网系统的功率调节,确保电网的稳定运行。但储能系统成本较高,在尽可能满足出力需求的情况下,配置合理的储能容量,是有效推进光伏发展的关键。目前,国内外不少研究者通过时频分析法进行储能容量的配置,常见的时频分析法有经验模态、小波变换等方法。但小波变换需要人为确定小波基函数,且基函数是无自适应性的,即该小波基可能在全局是最优的,但是在某些局部可能不是。相较于小波
学位
随着社会的发展,现代系统在复杂性、非线性和规模等方面都远比过去的系统大得多,单体系统已经不能满足实际工程,取而代之的是由多个子系统耦合而成的互联系统。然而,由于控制系统太大、太复杂,现实世界的控制问题不能通过一次性的方法来解决,所以集中控制方法解决控制问题就变得很困难。在以上种种的困难情况之下,分散式控制方法应运而生。此外,执行器饱和以及时滞等问题也会增加互联系统的不稳定性。因此,本文针对互联非线
学位
随着物联网设备数量的快速增长,被劫持的物联网设备组成的僵尸网络发起非法攻击的频率大大增加。这是因为大多数的物联网设备的计算、存储能力较低,使得物联网设备成为完美的僵尸网络节点,因此,物联网设备的安全性已经成为一个严峻的问题。因为物联网设备的数量大,种类多,所以针对物联网设备的流量检测需要考虑到各种类型设备工作的特点,从流量中提取合适的特征,然后训练设备的流量监测模型;另外,流量检测模型通常采用半监
学位
在LPWAN领域中,Lo Ra因其低功耗、广覆盖、组网灵活等特点与物联网的需求十分契合,被广泛部署在各个行业,但由于其物理层协议的私有性,Lo Ra的安全性无法得到保障,这也使其应用领域受到限制,因此开发Lo Ra底层的可替代技术变得尤为重要。本课题基于CSS调制技术设计了一套完整的物理层协议,包括对调制解调、信道编解码的研究设计与实现,利用CSS技术优异的传输性能,实现通信网络的远距离传输。具体
学位
量子参数估计是量子计量学的理论基础,而量子Cramér-Rao定理是量子参数估计中研究最为广泛的数学工具。在量子Cramér-Rao定理中,量子Fisher信息矩阵(quantum Fisher information matrix,QFIM)是表征多参数估计精度极限的关键量。近年来,人们从不同的角度对量子Fisher信息矩阵进行了比较丰富的研究。然而关于量子Fisher信息矩阵在低维自旋体系中的
学位