基于卷积神经网络的人脸表情识别问题的研究

来源 :山东大学 | 被引量 : 2次 | 上传用户:zcysun618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的快速发展促进了人工智能和模式识别技术的发展,使其逐渐被生活化,因此,人们对机器的智能化需求也越来越高。人们不仅期望机器人可以帮助人类完成体力上的工作,还期望机器人可以判断人的心理活动和真实意图,实现人与计算机有感情交流为目标的人机交互过程,从而更好地服务于人类。人们在情感传达时,面部是人们交流的核心部位,在面部区域中包含了人类大部分的感觉器官(眼睛、耳朵、鼻子和嘴巴等)。通过面部传达的信息,可以通过最直接、最自然的方式明白他人的意图,感受他人的情绪。同时可以通过辨识出对方的面部表情,判断其心理活动和真实的意图。因此,如何让机器人快速准确地识别人的面部表情,从而获取人类的真实意图,已经成为智能人机交互技术研究任务中的一大重点。人脸表情识别是一种智能的人机交互技术,在情感计算中占据着重要的地位,在国内外受到了许多学者的密切关注与研究。目前,图像分类器的性能有很大程度取决于提取的特征是否有效。卷积神经网络模型在当前计算机视觉和人工智能领域具有显著的优势,实现了图像特征信息的深层提取以及特征提取和分类的同步进行。通过卷积神经网络模型对人脸表情识别进行研究,不仅具有重要的理论意义,同时还具有很大的实际价值。本论文以人脸表情识别技术的需求为牵引,致力于提高采用卷积神经网络模型对人脸表情识别的准确性并兼顾计算效率,首先基于获取的实验数据集,提出一种减少误判率的人脸检测方法;进而提出了一种获取优质图像的数据样本扩充方法,用于卷积神经网络模型的训练,基于表情图像自身的特点设计了相应的卷积神经网络分类器,提升人脸表情的识别率。论文的主要内容及创新点如下:1、提出一种实现复杂背景下获取表情区域的人脸检测方法。由于人脸表情图像大部分都存在复杂的背景信息,影响了表情特征信息的有效提取,不利于最终的表情识别,提出了一种有效的人脸检测算法,将有用的图像信息提取出来。该算法由两种检测方法联合构成。首先采用传统的肤色模型对脸部表情进行初次检测,然后基于人眼定位的方法辅助调节初次误检的人脸图像,减少误检率,有效地减少了表情识别任务中的很多干扰因素。同时,为了加快人眼定位的快速性,采用图像区域分割的方法较少人眼搜索的时间,加快系统的运行速度。2、构造出一种减少表情崩塌图像的生成式对抗网络模型。由于卷积神经网络模型的训练离不开大规模数据集样本的支持,而现有的大部分人脸表情数据集的规模普遍不大,提出了用于数据增强的生成式对抗网络模型。该模型由基于神经网络架构的生成器和判别器组成。对模型的架构和目标函数进行了优化设计。此模型的优点是可以通过增大重构误差减少表情崩塌图像的生成,提升图像的生成质量,为后续模型的训练做好准备工作。3、针对较为夸张明显的表情图像数据集,提出一种基于关键区域辅助模型的卷积神经网络分类器。由于现有的大部分方法只采用人脸的全部图像作为模型的输入信息,往往抓不住有利于分类的重点特征信息,提出了辅助模型的方法。首先使用原始脸部图像获取第一层的特征信息,然后将关键区域的特征信息提取出来与第一层的特征信息进行融合,得到有利于表情分类的深层特征,进一步提升表情识别的准确率。此外,为了减少模型在训练过程中震荡的缺点,提出了新的分段激活函数。同时针对卷积神经网络在模型训练过程中比较耗时的问题,提出一种采用CNN与随机森林连接的方式对表情进行分类识别,为了提升随机森林分类器的效率,对信息增益率的公式进行了简化,并对随机森林分类器的决策算法进行了优化,实现了表情的快速准确识别。4、针对表情容易混淆的样本数据集,提出一种基于级联卷积神经网络识别模型,实现了部分易混淆表情的准确识别,此外,在获取的低维特征信息的融合环节,采用贪心算法将多种特征信息进行融合,降低了维数灾难的影响。同时针对表情混淆程度较大且很难人为区分的表情数据集,提出一种基于聚类和卷积神经网络模型结合的识别模型,在聚类的过程中,为了尽最大可能拉大聚类中心的距离,提出了基于固定初始值的角力算法,提升了表情的整体识别率和每个类别下表情的识别率。5、针对自定义卷积神经网络模型在构建过程中参数的调整耗时问题和传统迁移算法中存在的内容差异问题,提出将卷积受限玻尔兹曼机和卷积神经网络模型进行融合的方法,得到了一种新的混合迁移算法。因为采用数据增强方法虽然有利于卷积神经网络模型的训练,但是对于一些规模较大的数据集,数据增强处理过程也较为复杂,模型的训练时间较长,因此本章提出的迁移方法可以更好地应用到较大规模的数据集中。该算法利用卷积神经网络模型实现模型对源域的初次特征提取,继而采用目标域在初次学习特征的基础上继续学习更多有利的特征信息,然后采用卷积受限玻尔兹曼机对目标域学到的特征进行深层挖掘,减小迁移过程中数据集的内容差异带来的影响,提升目标域图像样本集的识别准确率。此外,为了使卷积受限玻尔兹曼机在可见层的卷积操作中获取更加全面的边缘特征信息,对其进行补零操作的方式。
其他文献
复杂网络科学的发展,已经成为研究各种复杂系统的有效工具。利用复杂网络的理论和方法探究复杂系统,具有重要的理论意义和实际应用价值。其中:识别多影响力节点是复杂网络领
外辐射源雷达自身不主动辐射信号,利用第三方照射源进行目标定位和探测,相比主动雷达具有低成本、抗干扰、无环境影响等诸多优势。模拟调频广播信号由于分布广泛,发射功率大,
对于不平衡数据分类来说,不同类别样本间数量的差异性,以及同类样本内部的信息缺失很大程度上制约了这些分类算法的准确性和合理性。虚拟样本生成技术可以有效的解决不平衡分类问题中由于样本数量差异而导致的决策面偏移的问题,同时可以有效的填补样本的信息间隔。在传统的不平衡样本分类问题的解决策略中,虚拟样本构建方法往往只是基于原有样本间的线性组合,由此而导致的数据特征过于单一的问题难以得到有效的解决。因此,本文
土地是一种非常珍贵和稀缺的资源和资产。在新经济常态的背景下,开发区是国家和地方在城市规划中建立的关键领域。对促进经济增长、区域发展和彰显开发区综合效益等方面至关重要。集约利用土地资源是开发区长期、稳定和可持续经营的先决条件。因此,如何实现开发区土地资源的高效与节约,经济的长期稳定发展是城镇建设用地集约利用的重要研究课题。本文以城镇快速发展与土地供需矛盾日益紧张的环境为前提,把两江新区工业开发区城镇
在古典概率论中概率极限理论占有重要作用,在概率和期望的线性可加性条件下得到经典概率极限定理问题.但是在实际问题中,许多不确定现象的产生,往往会出现概率和期望非线性的
水体环境中长期残留的氟喹诺酮类和磺胺类抗生素对公众健康具有潜在的危害。本文通过纯培养和共培养血红密孔菌(Pycnoporus sanguineus)和黄孢原毛平革菌(Phanerochaete chrysos
IPO信息溢出效应是指新公司IPO对其所在行业其他上市公司股价收益率产生的影响,包括积极影响和消极影响两个方面。目前对于IPO的研究主要集中在IPO抑价、IPO长期弱势等热门话
二氧化碳过量排放会导致气候变化和环境破坏。微生物电合成是一种较有前途的、可持续的技术,可以通过向微生物提供电能来形成细胞内还原当量,从而还原二氧化碳并合成燃料和化
在软件项目的项目管理工作中,开发任务分工是项目管理的日常及核心工作之一。快速而合理的完成开发任务分工,不仅能够减少任务分工工作对项目时间及人力资源的占用,并且益于开发人员承担更合适的开发任务,从而保证项目能够更加快速、更高质量的完成。本文以A公司电子商务项目的项目管理工作为研究背景,针对项目管理工作中经常出现的项目超期问题,从项目时间管理的角度去分析整个项目流程,分析并识别出任务分工耗时及分工不合
在低层视觉任务和多媒体应用中超像素算法已经被开发并作为基本研究工具。目前有很多超像素算法,包括基于分水岭的算法、基于密度的方法、基于图的方法以及基于聚类的方法,这