基于深度集成神经网络的人脸表情识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:svkisahero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习方法极大地提高了人脸识别的准确性,为了获得更高的识别准确率,集成学习可以应用于深度学习算法中。传统识别算法难以捕捉到面部表情所传递的有用信息,面部表情识别存在分辨率低、遮挡、光照、位置等问题,通常情况下,由于这些面部表情分类很差,人类无法识别它们。此外,面部表情的分类比较特殊,例如面部微笑并不总是意味着开心,面部表情往往取决于文化。然而,提高面部表情识别准确率可以应用到更灵敏、更智能的系统,从而改善用户体验。为了提高分类器的性能,降低人脸表情识别的错误率,研究者开展了很多的工作,例如基于深度学习方法。有时候深度学习对面部表情识别存在困难,原因有很多,比如基于深度学习人脸面部表情识别应用是一项复杂而困难的任务,又例如很难找到高质量的数据集,深度网络的性能在很大程度上依赖于大量的标记样本。本文提出了一种基于卷积神经网络和集成深度网络的新方法,可面向小样本数据集分类情况,这些方法分别是多视角卷积神经网络(MVCNN)和集成迁移学习网络(ETLN)。首先,将人脸图像通过不同尺度进行下采样,然后向上采样到统一图像大小,得到多视角训练样本。然后,构造了一个具有双通道特征提取结构的多视角卷积神经网络(MVCNN)。通过一个视角的训练样本对其中一个通道进行训练后,将参数迁移到另一个通道,使用不同视角的样本进行微调。在此基础上,我们利用基于迁移学习特征和深度模型集成方法对多视角卷积神经网络(MVCNN)的结果进行了增强。首先,设计的DCNN网络来识别人脸图像,DCNN权重随机初始化。再分别利用VGG16和VGG-face网络通过迁移学习方法构造人脸分类器Transferred VGG16和Transferred VGG-face模型,将上述的各个模型进行聚合,构建鲁棒性强的集成转移学习网络模型(ETLN)。ETLN的性能通过对集成模型的权重分析之后得到了明显的提高,其中特征的最优组合达到了最高的精度。这些方法已在FER2013和RAF-BASIC数据集上实验和测试,并与同类方法进行了比较,对识别结果进行了评价。实验结果表明,该方法可以提供更高的准确率,其中MVCNN分类器在FER2013的测试集上的准确率为72.27%,ETLN分类器在FER2013和RAF-BASIC上的准确率分别为74.12%、85.94%
其他文献
随着我国竞技体育商业化、职业化的不断发展,比赛中的伤害事件也层出不穷,严重威胁了竞技体育参与人的生命安全,进而影响了这一产业的进一步发展,面对竞技体育比赛中的伤害行为,大多由体育领域“内部自行解决”,排斥刑法的干涉。本文从根本上肯定了竞技体育中违规伤害行为的可罚性,从两个典型竞技体育伤害事件入手,以现有的研究理论为视角,为刑法的介入范围概括出具有普适性的划分标准,提出违反竞赛规则与项目自然风险双判
炫耀性消费具有两重的影响:一方面有浪费社会资源的负面影响,另一方面在社会交往当中也能起积极的作用。炫耀性消费的社会动机也可分为功效和炫耀两个方面。研究表明,炫耀性消费通过某种介质对社会交往产生的积极影响,炫耀性消费与声誉之间可以建构重要的内在关联。本文以对历史文献中对炫耀性消费行为的讨论为起点,考察炫耀性消费行为的动机,在前人的基础上提出一个新的解释性假说,并建立模型刻画这一新解释的内在机制,指出
并购已经成为我国经济活动中的重要组成部分,对公司结构和治理水平产生了较为深远的影响。国内外的学者围绕并购展开了较为深入的研究,多从经济学的角度围绕并购绩效进行研究,少有以供应链内部整合为基础的运作绩效作为主要绩效衡量指标来检验横向并购行为发生前后企业绩效变化情况。由此,针对这方面的研究缺失,本文以供应链内部整合的视角出发,选取运作绩效相关指标,验证横向并购与运作绩效之间的关系,并提出相关建议。本文
随着近几年海洋资源的深入开发,水面无人艇因为其优秀的运动特性而被广泛研究应用。针对水面无人艇广阔的市场前景,国内外学者在其运动特性、艇型优良设计,以及水动力优化等
目前对热水沉积区优质烃源岩的研究以及热水沉积与优质烃源岩成因机理关系研究,还相对比较薄弱。对热水沉积与优质烃源岩的相关性与成因机理的研究,不仅属于一项基础研究,而且对于油气的勘探开发均具有重要的理论和实际意义。本研究拟以黔北地区下寒武统牛蹄塘组黑色页岩为重点,系统采集黔北贵州省贵阳市清镇市百花湖乡温水村,遵义市遵义县松林镇中南村,毕节市织金县桂果镇联兴村,黔东南州麻江县下司镇羊跳村,黔东南州丹寨县
正交频分复用(OFDM)是一种适用于高速无线传输的多载波调制技术。它已经被广泛的应用于多径衰落条件下,具有频谱效率高、抗多径衰落等优点。OFDM与生俱来的高峰均比问题限制了它的广泛应用。在许多文献中提出的很多的峰均比(PAPR)降低技术中,子载波预留技术已经受到了很多关注。该技术使用一些预留子载波来产生峰值减小信号以降低OFDM信号的峰均比。然而,获得优化的峰值减小信号需要解决一个二次约束的二次规
时间序列是否具有混沌特性决定着预测方法的探究及其相关性质的讨论,影响着时间序列预测的准确性,混沌辨识为时间序列的预测提供了重要的理论前提,因此,混沌辨识研究在时间序列分析上具有极其重要的地位.本文主要采用有序模式、排序熵等研究方法及混沌理论对降雨量时间序列、径流量时间序列以及交通流时间序列进行研究.首先,对降雨量时间序列和径流量时间序列以及交通流时间序列进行数据预处理.其次,引入基于有序模式的三态
随着中国物流行业的蓬勃发展,物流在不断凸显其对我国经济发展的基础性作用的同时也带来了巨大的挑战。在当前物流行业的粗放发展模式下,物流成本过高的问题已经成为物流行业
本文为《铁路桥涵混凝土结构设计规范》汉译英翻译实践报告,是作者读研期间参与的一个基于计算机辅助翻译工具的协同翻译项目,作者负责其中约16000汉字的翻译。本报告首先介绍了该翻译项目的大致情况,阐述了该项目的实际意义,分析了客户要求,并梳理了本报告的脉络结构。其次,本报告回顾了项目译前、译中与译后的过程。之后则重点解释了技术文本中专业术语的含义及特点,并阐述了专业术语翻译的原则。本文的一大创新在于:
隐藏吸引子是一种新的吸引子,与典型的Lorenz、Rossler、Chen吸引子不同,它不包含平衡点的邻域,也不能用传统的计算方法去计算这些隐藏吸引子.第一章讲述吸引子理论研究的背景和意义,并介绍隐藏吸引子的一些预备知识,如:新分析-数值算法的思想、谐波线性化和稳定周期解的定位.第二章研究一类非线性Van der Pol-Duffing振子,研究这一非线性系统的隐藏吸引子.首先,通过计算系统的特征