基于局部模式的人脸识别研究

来源 :杭州电子科技大学 | 被引量 : 1次 | 上传用户:kingper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代计算机视觉技术的不断发展和硬件计算能力的不断提高,人脸识别相比于指纹识别等其他生物特征识别技术,由于其非侵扰、高效率、友好性等诸多优势,已广泛应用于电子商务、罪犯识别、电子支付、门禁考勤等多个场景,近年来得到大量研究人员的关注。由于基于局部模式的人脸识别方法主要对图像的局部纹理进行分析并提取局部特征,因此对于表情、光照等局部变化表现出一定的鲁棒性。但是,目前局部模式方法单一的特征表达很难抵抗不同环境,导致对不同使用场景的鲁棒性较差。另外,由于局部模式过于关注单张图像局部信息,仅利用局部模式学习到的特征有限,如果不融合其他特征,很难实现对人脸特征的充分表达。基于这些考虑,本文综合局部采样、模式编码优化及利用多尺度特征补充等多方面改进,以增强算法的识别效果。主要工作如下:(1)针对局部方向数(LDN)类方法的人脸识别通常仅利用梯度信息且存在信息提取不充分的问题,提出双偏差双空间局部方向模式(DVDSLDP)。该方法首先通过像素采样扩大关联邻域信息,再利用边缘响应算子和局部前后向差分,分别获得相对偏差和绝对偏差以构成双偏差信息,充分挖掘局部梯度空间信息;然后与所提取像素的灰度空间特征级联融合,以获得双空间特征,再进行模式编码得到特征图;最后依据信息熵加权级联各子块直方图获得人脸特征向量,使用最近邻分类器完成分类。针对ORL、Yale、AR人脸库和相关典型方法的对比结果表明:利用双空间特征的融合,获得了轮廓更清晰、纹理更丰富的编码特征图,在ORL和Yale库上分别达到了99.5%、94.44%的识别率,尤其是在训练样本较少时性能提升明显;同时,特别需要提及的是,该方法针对AR库的表情、光照、遮挡A和遮挡B子集分别达到了99.67%、100%、99.33%和97.33%的识别率,明显高于其它方法,表现出良好的鲁棒性。(2)针对局部二值模式(LBP)及局部图结构(LGS)方法因非均衡的提取方式导致特征表达能力不强,以及单纯提取局部特征不能全面描述人脸信息的局限性,提出基于均衡局部模式DOG多尺度融合的人脸识别算法。首先针对LBP、LGS的不足,在利用双圆交叉采样和以局部宏观信息为参考的自适应阈值、中心对称的采样图结构实现均衡优化的基础上,提出可变参的延展交叉型局部二值模式(ECLBP)和四星型局部图结构(FLGS)方法,合称为均衡局部模式,增强了对关键特征信息的提取。然后将经高斯核及图像差分生成的DOG金字塔与均衡局部模式方法融合,补充的多尺度特征图在丰富样本信息的同时实现了大尺度全局轮廓和小尺度局部细节的融合,可进一步捕捉类间及类内差异特征。最后加权级联所有特征图各子块的统计直方图,得到更加全面准确的特征向量,采用最近邻分类器实现匹配识别。特征图、直方图的主客观对比,从理论上验证了均衡局部模式获得信息更丰富、判别性更强的局部特征。针对ORL、AR、LFW人脸库和相关典型方法的对比结果发现:在时间消耗相当时,均衡局部模式的识别率提升最高达15.52%;进一步融合DOG金字塔后,识别率再次提升最高达9.24%。实验结果表明:均衡局部模式特征明显拥有更强的表征能力及鲁棒性,补充的多尺度信息进一步增强了特征性能,尤其在少样本环境,当样本信息有限时,算法的整体优势更加明显。综上所述,针对局部模式的人脸识别研究表明,多空间特征融合可以有效增强对关键局部特征的利用,提高识别算法的鲁棒性。此外,局部采样和模式编码的均衡优化可以帮助算法捕捉更多有效的局部信息,补充的多尺度特征可以进一步弥补单纯利用局部模式提取特征在描述人脸信息时过于片面的局限性,进而有效增强算法的整体识别性能。
其他文献
卟啉因其优良的光、电、磁性质被广泛研究。作为有机发光分子,卟啉在稀溶液中表现出强的红色荧光,而在高浓度溶液中荧光发射很微弱,这主要是卟啉分子之间通过范德华力、氢键
传统的观点认为,价值创造指的就是交换价值,在这个过程中,企业是创造价值,并通过价值链将价值传递给顾客,而顾客只是价值的接受者和使用者。随着互联网、云计算、网络经济、
近年来,酰腙作为稳定的亚胺替代物,在有机合成中越来越受到人们的关注。它可以和许多亲核试剂发生反应,生成各种含氮化合物。它发生的常见的反应主要有:酰腙的还原反应、Mann
随着自然语言处理的不断发展,实体关系抽取作为信息抽取中的一个重要子任务受到许多研究者的关注。实体关系抽取可以分为开放域实体关系抽取和限定域实体关系抽取。限定域实
目前,随着科技的发展和普及,学习形式也越来越多样化。在线学习已经成为了一种重要的学习方式,并且每天都有大量的学习视频上传到网上。演讲视频是其中一种非常重要的学习资料,但是这些视频都未结构化,如果用户想要了解演讲视频中某个具体的知识点,他们往往要浏览整个视频才能找到。这种学习方式会大大降低学习者的学习效率。因此,很有必要利用演讲视频摘要技术自动化地提取演讲视频中代表性的知识信息。目前,很大一部分录制
烂木沟金矿床位于秦岭造山带南秦岭构造亚带碌曲—旬阳印支褶皱带中段,属秦岭板块南秦岭逆冲推覆系构造岩片。前人对烂木沟地区以西成矿带金矿地质特征、控矿因素、矿床成因的研究较多,观点各异,但对烂木沟地区的研究较少,缺乏系统分析。本文综合分析了区域成矿背景,对烂木沟金矿床进行了详细解剖。通过对矿区地质调查、薄片显微观察、矿床地球化学及同位素年代学等方面的研究,查明了矿体分布特征、矿区控矿构造、可能的成矿物
在气候变暖的大背景下,多数陆地地区的极端气候事件频率和强度都呈现上升趋势,研究长江流域极端降水的时空变化特征及区域频率,可以为流域内的防洪减灾工作提供参考。本文基
力学反问题具有广泛的工程背景和学术价值。力学反问题主要包括确定未知物性参数、识别边界几何形状、求解未知边界条件和缺陷检测等几种反问题。这几类问题一般是不满足适定
正交频分复用(OFDM)技术自上世纪六十年代诞生于美国贝尔实验室,现已广泛运用于有线和无线通信中并成为了长期演进技术升级版(LTE-A)的标准。而将OFDM技术运用于光网络,并得益于
联络口译是应用最为广泛的一种口译形式,与会议口译相比,联络口译正式性相对较低,因此也更为灵活。在联络口译过程中,译员处理信息时往往会发挥自身主观能动性。然而,在口译实践中,译员可能会质疑这一做法是否符合译员职业道德。产生质疑的原因在于,传统的译员角色要求译员遵守绝对忠实的原则。而随着口译相关研究的发展,译员逐渐找到了自身作为“人”而非“机器”的角色。在这些角色当中,基于传播学“把关人”理论而出现的