基于残差网络的人脸表情识别方法研究

来源 :中国人民公安大学 | 被引量 : 0次 | 上传用户:hongyin_wangyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是人类表达情感和进行社交的重要方式,人脸表情自动识别在自动驾驶、辅助医疗、智能控制等人机交互任务中应用广泛。近年来随着深度学习技术的发展,人脸表情识别研究取得了显著的进展,但是现实场景下的人脸表情识别仍然受到遮挡、姿势变化和背景干扰等因素的影响,识别准确率仍有待进一步提高。本文以残差网络为基本架构,引入联合正则化、注意力机制以及二阶池化层等优化措施,改进了人脸表情识别方法,在公开数据集上进行了测试和验证,结果表明,改进后的模型具有较高的准确率和鲁棒性;此外,进行了人脸表情识别交互页面的设计与实现。主要内容包括:(1)以残差网络为基本框架,将过滤器响应正则化与批量正则化、实例正则化和组正则化、组正则化和批量正则化分别嵌入网络之中,提出了联合优化策略,弥补单一优化的不足,尽可能保留有效的特征信息,平衡和改善特征数据分布,弥补单一正则化的弱点,提升模型性能,在FER2013数据集上取得了73.558%的准确率,在CK+数据集上取得了94.9%的准确率,验证了所提方法的有效性。(2)以残差网络为基本架构,在联合正则化基础上,引入卷积模块注意力机制(CBAM),提取通道和空间上具有强表达能力的特征,并且减小无关特征的权重,进而提高模型的准确率,在FER2013数据集和CK+数据集上分别取得了73.753%和95.7%的准确率,展现了较好的竞争力。(3)基于残差网络,融合了瓶颈注意力机制以及全局二阶池化层,其中瓶颈注意力机制使网络专注于表情重要特征的提取,全局二阶池化层使网络可以充分利用图像中的二阶统计量信息来探索表情特征之间的相关性,在此基础上通过联合正则化策略,平衡和改善特征数据分布情况,提高表情识别准确率,在FER2013数据集、CK+数据集和SFEW2.0数据集上其准确率分别达到了74.227%、95.8%和56.1%,性能优于诸多现存的主流方法。结果表明,所提出模型具有较好的准确性和鲁棒性。
其他文献
学位
学位
学位
学位
学位
行人跟踪与再识别技术是计算机视觉领域的重要研究方向。行人跟踪是根据视频初始帧中行人的状态预测其后续运动轨迹;行人再识别是通过技术手段对不同点位行人图像进行相似性度量,判断是否属于同一个人。由于行人姿态多变、环境存在差异,行人跟踪与再识别技术易受遮挡、形变、脱离视野等因素影响,导致算法准确率较低,在实际应用过程中难以满足现实需求。因此,行人跟踪与再识别方法具有一定的研究价值。本文围绕基于孪生神经网络
社区是我国老年人日常居住、活动的主要区域之一,老年人在社区室外活动及出行过程中面临多种威胁其身体健康乃至生命安全的风险,这些风险在时空轨迹上往往表现出一定的异常性,例如,在外出时意外摔倒、走失、因体力不支而被困等。然而,目前专门针对社区老年人异常轨迹预警的相关研究和系统应用极少,因此,本文融合轨迹数据、身份属性数据、天气数据,研究社区老年人异常轨迹预警方法,设计并实现预警系统。本文的研究内容和结果
行人再识别是计算机视觉技术的热点问题之一,主要对不同摄像机点位获取到的图像或视频序列中的行人目标进行检索匹配和同一认定。受光照、复杂背景、遮挡以及行人姿态各异的影响,行人再识别算法在实际应用中存在提取特征鲁棒性较差的问题,导致识别精度较低,难以满足实际应用需求,因此行人再识别受到众多学者的关注。本文围绕基于深度学习的跨域行人再识别方法,在行人检测、行人再识别、人脸识别等方面展开研究。具体工作内容如
目前,互联网中越来越多的数据冗余堆积,严重影响人们获取感兴趣的事件信息,如何利用好海量的数据信息,对其进行抽取识别,挖掘出大量数据背后隐藏的价值,是事件识别领域的研究方向。通过传统的模式识别和机器学习方法来处理突发事件识别,在面对复杂问题时,模型表现能力较为局限,对于深层次事件信息特征的抽取,模型的泛化能力和特征的提取能力受到一定程度的制约。本文针对以上问题,采用深度神经网络作为主要研究手段,开展
网络高速发展,推动社会经济民生高速发展进步,我国已然成为世界上网络建设使用强国。鉴于网络有着高效、互联,使用成本低且网络参与者之间无直接接触等特点,诸如诈骗、盗窃、赌博、贩毒等传统犯罪为降低犯罪成本,提高犯罪收益,并逃避公安机关的侦查打击,逐渐将具体犯罪行为借助网络实施,取代了面对面的直接接触实施。犯罪网络化具有“五C”特点,即隐蔽性特征(Cryptic)、互联性特征(Connected)、复杂性