基于卷积神经网络的人脸表情识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fenglilong_liumang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是人与人进行信息沟通交流的重要手段。与其它图像视觉领域不同,人脸表情的识别过程中,存在着表情特征十分细微以及表情持续时间较短等问题,这些难点使得人脸表情识别在实际生活中的应用受到限制。基于深度学习对人脸表情识别的现有研究多采用对网络模型进行探索和优选的方式,缺少对模型的理论研究。本论文基于光照标准化和卷积神经网络特征提取可视化方法,提出了一种多尺度融合的卷积神经网络模型,并设计实验对模型的优越性进行了论证。论文的主要工作如下:(1)探究了处理人脸表情识别中光照噪声的光照标准化算法。基于光照标准化算法的基本原理,研究了伽马校正、高斯-拉普拉斯边缘提取和TT等在人脸识别领域中表现较好的光照标准化算法。利用Alex Net卷积神经网络分类器,分别训练和测试了使用这些算法处理后的FER2013数据集,并根据实验结果,优选了一种合适的算法作为处理FER2013数据集的光照标准化算法。(2)研究了不同深度下卷积神经网络层对于表情特征提取的性能。基于可视化卷积神经网络方法,利用Grad-CAM技术,对传统VGGNet16网络中不同深度下卷积神经网络层所提取的特征分别绘制了分类权重热力图,并分析了各深度卷积神经网络层权重热力图的深层含义,得出了VGGNet16中对于人脸表情识别精度提升作用较大的网络层次信息。(3)基于模型特征提取性能研究,提出了一种改进的多尺度融合VGGNet16卷积神经网络。使用模型特征提取性能研究的结果作为理论指导,结合Inception结构、批量标准化和Dropout技术,构建了在宽度和深度上均有不同尺度特征融合的多尺度融合VGGNet16卷积神经网络,并在FER2013数据集上论证了所提出模型的优越性。(4)设计和实现了一套人脸表情识别系统。基于提出的多尺度融合VGGNet16卷积神经网络,设计了一套人脸表情识别系统,对静态人脸图像和动态人物视频进行了人脸表情识别实验,并通过实验论证了论文提出的模型在实际场景中较好的应用价值。
其他文献
1,2-二羰基单元是一类活泼的双官能团结构,众多具有生物或药物活性的天然产物、药物分子都是含有该官能团的化合物。此外,该类化合物还常见于食品化学及材料化学等领域。同时
随着数字几何应用的不断发展,对三维模型的需求量与日俱增,但在使用3D扫描设备获取三维模型的过程中,不可避免地会引入不同复杂程度的噪声,因此三维网格模型去噪,是数字几何
本文采用氢化、空气热处理和水热法制备出氢化纳米颗粒、海胆结构和暴露{012}、{102}和{112}活性晶面的立方体α-Fe203及暴露清洁{020}高能晶面的六角星状InOOH,采用X-射线衍
利用现代材料生长技术,实验上可以实现所谓的磁调制半导体纳米结构,这是一种磁性材料和半导体材料混杂的量子小系统。由于小尺寸、低维度与量子受限,磁调制半导体纳米结构中
乳腺癌具有发病率高、死亡率高的特点,已成为威胁妇女健康和生命的主要疾病。乳腺癌的早期筛查和早期诊断是挽救患者生命最有效的方法。乳房X线检测是乳腺癌筛查中最重要的影
由于本身的科学意义和在磁信息存储领域的重要应用,比如,随机存储器、高密度读写磁头、超灵敏磁场传感器等,磁阻(magnetoresistance,MR)效应一直以来都是凝聚态物理、材料科学
枳壳是具有理气宽中、行滞消肿功效的一种中药材,需将该未成熟果实自果梗痕-花萼轴线中部定向横切为两半,然后晒干才能确保枳壳质优。目前由于枳壳定向切分技术的缺乏,其加工
自从1960年Kalman等人提出卡尔曼滤波的基本原理以来,卡尔曼滤波就成了线性估值领域的重要算法。由于现实中的问题大多都是非线性的,1968年Sunahara等人对卡尔曼滤波进行了变
卵巢卵泡发生是一个高度组织的发育过程,卵泡发育的任何一个过程或环节发生紊乱,都会影响卵巢发育和卵巢的功能,进而影响生育。TGF-β超家族成员在卵巢卵泡发生过程中起重要
有机半导体激光器(OSL)因其具有光谱可调、制备简单、成本低廉、集成方便等优点,在发展小型可调谐激光器、柔性激光器、显示照明以及光电子集成器件等方面具有广泛的应用前景