基于深度学习的人脸表情识别研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:dexter001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的人脸表情识别在安防、在线教育、医疗以及服务性机器人等领域均得到了广泛的应用。由于受光线、头部姿态、性别和年龄等因素的影响,在真实环境下的人脸表情识别仍然是一个很具有挑战性的研究课题。针对以上问题本文分别从两个方面对人脸表情识别进行研究。首先是对基于静态图片的人脸表情识别进行研究,其次是对基于视频序列的人脸表情识别进行研究。主要内容包括以下两个方面:对于静态图片的表情识别,在基于Visual Geometry Group Network16(VGGNet16)网络模型上进行了改进。首先在VGGNet16模型的侧方添加一系列的侧输出层,并在该侧输出层添加不同的卷积核。然后通过上采样和下采样方法连接侧输出层的上下两层,并通过训练使侧输出层能够对其上下两层的表情信息进行加权融合。在VGGNet16第五层的后方添加两种不同的卷积核。将侧输出层的最终融合特征定义为局部特征。将VGGNet16输出的最终特征定义为全局特征。最后将局部特征与全局特征进行融合得到最终要进行分类的特征。该模型在The Extended Cohn-Kanade(CK+)数据集上的识别率为98.6%,在Real-world Affective Faces(RAF-DB)数据集上的表情识别率为79.59%,通过对比常用的模型在两种数据集上的识别率发现该模型具有很大的优势。对于视频序列的人脸表情识别,本文在基于静态图片的表情识别的基础上研究视频序列的人脸表情识别。使用基于改进的VGGNet16模型对图像中的空间特征进行提取,同时使用光流法提取图像中的时间特征,并将提取出的空间特征与时间特征进行融合。最后使用注意力机制对融合后的特征进行加权,并对加权后的特征进行训练和分类。最终该模型在Acted Facial Expressions in the Wild(AFEW)数据集上的识别率为61.11%。
其他文献
作为艺术形式的一种,电影具有许多功能,它不仅可以传播信息,还是娱乐大众、教育大众的绝佳手段。导演将许多文化信息、观点、感受和观念藏于他们的电影作品之中,电影的研究价值也正来源于此。因此,包含异国元素的电影作品成为跨文化研究领域的研究对象之一。在本篇论文中,作者选取了三部法国当代电影以研究法国电影中所反映的中国人刻板印象。在法国电影中,我们总是能发现一些与中国实际状况不相符的画面和对白,更为糟糕的是
【正】1积极推进乡村环境保护提高乡村自然景观美感乡村自然景观是黑龙江省乡村旅游吸引力要素中最重要的方面。因此,提升黑龙江省乡村旅游吸引力首先要从提高黑龙江乡村的自
【正】 产品责任法,从严格意义上讲,是本世纪六、七十年代在西方主要资本主义国家发展起来,并逐渐从民法尤其是有关的买卖法中独立出来形成的专门、统一调整因产品造成他人损
骨质疏松症被世界卫生组织(WHO)评为第二大危害人类健康的疾病,仅次于心血管疾病。我国随着改革开放带来的高度城市化、人口老龄化进程的不断加快和不健康生活方式的广泛流行,
动能拦截器作为目前最现实可行的弹道导弹防御武器,已成为世界军事领域研究的焦点。动能拦截器的飞行过程分为初始段、中段和末段,其中飞行中段时空跨度大,攻防双方对抗激烈,
细胞凋亡(apoptosis)是细胞在机体内和外界环境多种因素所诱导并受基因调控的一种生理死亡,是机体维持稳态的重要机制之一。随着肿瘤发生的观念由细胞生长过度扩展到细胞不死,
目的:探讨超声引导下穿刺组织块悬液注射法建立兔肾VX2瘤模型的价值,并与术中组织块包埋法相比较;观察兔肾VX2瘤的生长状况、回声类型、边缘征象及血供变化的动态演化过程。为肾
通过构造反例,辅助说明一致收敛和几乎处处收敛、依测度收敛和几乎处处收敛、可测函数和连续函数等概念间的关系,以加深学生对相关知识的理解.
针对软件质量保证与测试课程教学实践过程中发现的问题,以项目驱动为前提,从教学方法与手段、实践大纲、考核方式改进等方面,对软件质量保证与测试这门课程的教学模式进行初
当代多元化艺术发展飞速,艺术内涵也随之不断扩宽,新写实主义绘画逐渐走进大家的视野。新写实主义是对数十年来对写实绘画探索与借鉴,并在此基础上引进新的理念与表现手法后