基于特征融合与投票模型的人脸表情图像识别研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:iversonKKE3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机交互领域是现在社会科学的研究热点,计算机技术的不断进步催生着越来越多的人机交互新业态。近年来,随着智能设备穿搭,手机面部解锁等研究的兴起,人脸表情识别成为人机交互的研究热点。本文主要研究提取人脸表情融合特征,改进两种表现优异的卷积神经网络,将机器学习与深度学习的优点结合。然后通过实验进行分析比较。本文的主要工作如下:1.对人脸面部表情数据库进行裁剪和尺度归一化。论文采用CK+、JAFFE和FER2013三个人脸面部表情数据库,运用Adaboost算法粗略裁剪人脸面部表情图像,对于裁剪过后的面部区域图像采用尺度归一化处理的方式,得到相同大小的人脸面部表情图像。最后,多维度分类表情特征提取方式与分类算法,对比各自优缺点。2.本文提出一种基于Dlib特征融合的表情识别方法。综合考虑学习规则、面部表情特征选取了两个用于对人脸面部表情进行特征提取的经典算法LBP(局部二值模式)和Gabor小波变换,在SVM与softmax中挑选最优分类器,将两种算法与两种分类器进行交叉实验。引入Python中用做人脸识别的Dlib库提取人脸68个特征点,并将LBP和Gabor小波变换提取的特征经均匀采样降维后与Dlib提取的68个特征点进行融合,放入最优分类器SVM中进行分类,最终得到经过实验确定的适用于人脸面部表情识别与分类的特征融合模型,在CK+数据库中,该模型最高正确识别率为96.0%,在JAFFE数据库中,最高分类正确率为94.3%。从正确率可以看出该模型对于人脸表情识别的优异性。3.提出一种基于改进卷积神经网络的投票模型。对进行面部表情实验表现优异的两种卷积神经网络算法VGG19与Resnet18进行改进,更改池化方式为金字塔池化,并将卷积核大小由3×3改为1×1,提高了模型正确率。将VGG19、Resnet18与LBP与Dlib的特征融合模型组成投票模型,验证了投票模型在人脸面部表情识别的准确性和有效性。其面对两个小数据库JAFFE和CK+时,取得的正确率分别是98.59%和99.64%,在面对大数据库FER2013时取得的正确率为74.58%,对比其他识别方法都有明显的优势。投票模型解决了对于不同大小的数据库的普适性问题,取得了非常优异的分类效果。
其他文献
我们注意到,在量子力学教材中,往往对基本概念有的不同表述.如何认识这些令人困惑的差异?文章就对应原理、互补原理、波函数满足的条件、力学量算符厄米性与本征值、能量与时间的
DNA,具有独特双螺旋结构,制作的光电子器件具有优良的光电性能,作为主客掺杂基底材料,表现出优异空间位阻特性;芴类荧光材料,具有共轭结构,受激辐射截面大,荧光量子产率高,易于合成及
本文研究Nd14Fe80B6磁体和(Nd,Pr)12.8Dy0.2Fe77.4Co4.0B5.6磁体在不同热变形温度磁取向、显微组织和磁性能,磁体均在720℃热压2min,之后进行热变形,变形量为70%,热变形时间为4min
众所周知,量子关联是量子信息处理的一种很重要的资源,例如量子纠缠和量子失协,而量子纠缠已经被广泛地研究了,量子纠缠作为一种很重要的资源显示其广泛的应用前景,量子纠缠可以应
随着互联网技术的逐渐成熟,智能设备的普及,信息数量已经呈现爆炸式增长,人们的时间也被碎片化,短视频也已成为人们在碎片化时间里获取信息的重要途径。2017年开始资本疯狂注入短视频行业,短视频瞬间成为大众的宠儿,抖音、快手、微视等短视频平台用户数量暴增,PGC+UGC的短视频数量也随之增加。2018年短视频不再只以搞笑娱乐类内容为主,增加了各种各样的其他玩法,但内容的同质化依旧严重,制作精良的短视频只
碰撞安全问题中移动边界层问题是科学工程计算中的难题,运用非牛顿力学大变形理论并结合仿真分析技术解决该问题是一个行之有效的途径。本文在宏观尺度上使用描述粘弹塑性材料
两司书吏肩膺协助司道处理一省刑名、钱粮档案之责,清代律法为他们设计了一整套较为细致的组织形式和运行模式,这一整套制度随着清代社会的发展不断完善。咸同之后,频繁的内外战争使得两司长官难于久任,无暇处理政事,两司书吏的权力逐渐有上涨的趋势。到了光绪时期,两司书吏更加精于在制度规定的范围内对自身的权力进行弹性延伸,从而达到自身利益最大化。这在相当程度上使晚清吏治进一步陷入窘境。清末,清政府为了纾解吏治困
次氯酸在日常生活和工业中被广泛的用做抗菌剂和清洁剂,并且C10-是一种重要的生物活性氧,内源性C10-是生命必需的,有重要的抗菌特性,是生物体免疫系统最关键的活性氧物种。但
相比于传统雷达,多输入多输出(Multiple Input Multiple Output,MIMO)雷达体制的突出优势主要体现在:此类新型体制能够利用各种分集技术克服雷达散射截面(Radar Cross Section,RCS)起伏,获得超出实际收发天线数目的信号观测通道,提高目标探测能力和参数估计精度,具有抗干扰、抗隐身等方面的潜力。但是在具有高分辨率和多信号通道优势的同时,MIMO雷达体制也
两个正数的平均及其不等式广泛应用于统计学和数学以及工程技术领域。本文讨论单参数平均、Gini平均、几何平均、算术平均和海伦平均的一些精确不等式。找到最佳值p,q,s1,s2,