基于人脸图像稠密匹配的身份识别技术研究

被引量 : 0次 | 上传用户:yuyadong119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着平安城市建设的不断深入,身份识别技术扮演着越来越重要的角色。基于人脸图像的身份识别(简称人脸识别),作为生物特征识别技术的一类,因其自然性、非侵犯性等特性,而得到学术界与市场的重视。目前,控制环境下有配合的人脸识别,已达到实用级别,但是在自然场景下的人脸识别,由于姿态、光线、表情、饰物遮挡等等因素,还远未达到可接受的识别性能。要实现自然场景下实用的人脸识别系统,还需重点研究以下关键问题:(1)稳定健壮的识别算法,算法对姿态、光照、表情、遮挡等变量中的一种或者多种具有很好的抗干扰性且表现均衡;(2)如何达到满足实用的识别性能,包括速度快、准确率高(理想情况为接近或者超过人眼识别水平);(3)如何在学习样本较少的情况下,保证较高的识别率,而在学习样本较多的情况下,则能有效利用数据学习,进一步提高识别率。针对这些问题,本文进行了相关研究,主要工作和创新点如下:1,提出了一种新的人脸识别思路:传统识别通过降维等方法找到人脸特征子空间,根据子空间内的距离来度量相似度,而本文则是通过直接比较人脸图像对,根据两张图像的匹配代价来度量相似度,识别无需降维或者复杂的特征提取设计,不依赖于大规模的样本训练学习。具体实现借鉴了3D立体视觉领域中的稠密匹配技术并加以变化利用,即同样求解匹配点,但并不使用它们,而是使用求解过程中产生的匹配代价(原稠密匹配过程中的副产物),再通过聚合策略,将点层面的匹配代价转变为图层面的匹配代价,最后根据匹配代价,定义两张图像的相似度准则。2,针对人脸图像的光照和表情问题,提出了一种可以抵抗光照与表情复合变化的身份识别解决方案。该方案包括2种算法,基于最小强度差树模型的MIDT算法(MIDT速度优化版算法FTM),和基于特征与区域梯度融合模型的FRGF算法。(1)MIDT算法:通过定义一种对光照干扰保持不变性的距离度量准则,建立最小强度差树模型,并在树上汇聚匹配代价,得到图像对之间的相似度用于识别,在AR数据库上的实验表明,算法在表情和光照变化的干扰下,依然可以保持很好的识别率(平均95.3%),且对于不同类型的表情与光照影响,表现出很好的稳定性(波动不超过9%),此外,考虑到MIDT工程化的速度问题,设计出一种最优化聚合策略,得到了基于MIDT改进的快速识别算法FTM,达到实时识别性能。(2)FRGF算法:融合了特征与区域梯度在抗光照与形变方面的优势,实验表明,相比MIDT (FTM)算法,FRGF算法不仅保持了良好的对表情和光照变化抗干扰特性,而且获得了更为出色的识别性能(平均识别率99.1%)。3,针对人脸图像的姿态和遮挡问题,提出了一种可以抵抗姿态与遮挡复合变化的身份识别解决方案,该方案包括2种算法:自适应多粒度APP算法(APP速度优化版算法FSI),和基于去噪自编码器的ISDAE算法。(1)APP算法:先利用极几何对齐人脸,再在像素级别和图像特征块级别上分别求解对应点的匹配度,同时加入自适应模块,以解决姿态倾斜对人脸表观产生的扭曲问题,最后通过聚合得到图像对之间的相似度,在一些挑战性的数据库如CMUPIE和FERET上的实验表明,APP在解决姿态问题上处于前沿水平(识别率分别达到92.3%和95.1%),此外,考虑到APP工程化的速度问题,提出了基于APP改进的快速识别算法FSI,算法达到实时识别性能,且在姿态变化幅度较小时性能良好(识别率97%)。(2)ISDAE算法:借鉴深度学习思想,利用去噪自编码器,开发了一套抗遮挡问题性能较好的识别算法ISDAE,实验表明,算法超过稀疏表达算法在遮挡环境中的识别性能。4,针对富样本下的学习问题,提出了一种样本学习算法SVMSR,它拥有传统学习算法如SVM、NN等所不具备的特性:若所获取的大量人脸图像训练样本,并不直接是待识别身份的人脸(甚至完全无关,这在实际应用中经常发生),SVMSR仍然可以利用这些数据,来提高原算法的识别率。此外,本文提出的如APP、FSI等算法基本无需修改,就可以直接使用SVMSR,实现在富样本环境中识别率的提升(约10%)。SVMSR算法采用对人脸图像之间的差异进行建模,利用稠密匹配技术提取特征,并对传统的SVM核进行修改,使其可以基于样本数据,判断两张图像之间的相似度。5,研究了海量视频中基于身份的镜头检索问题。传统检索主要是图像检索,类似于谷歌图像搜索,输入输出均为图像,而本文为镜头检索,输入输出均为镜头。针对该问题,提出了一种新的检索方法:基于视觉单词模型,根据人脸表观特性融合多种特征,并将镜头视为文本检索中的一个“文档”,利用人脸跟踪技术和TF-IDF建立文档描述符,最后基于VSM模型进行镜头“文档”的检索。在英国流行电视剧上的实验,准确率达到了87%(召回率85%),与一些前沿方法性能相近,验证了方法在镜头检索问题上的有效性。上述方法已部分应用于中科院先导专项“感知中国”中“网络视频传播与控制(XDA06030900)”课题,和国家科技支撑计划“增强型搜索系统架构,关键技术及测试规范的研究”(2011BAH11B01)课题之中。
其他文献
<正> 在四季如春的广州市,有一位被人们誉为"性病克星"的传奇人物,他就是走在国际医疗界前沿,在前列腺炎、尿道炎、湿疣疱疹的治疗上取得了突破性成果,首创"强力以毒攻毒排毒
<正> 为探古揽胜,我几番跋涉于长白山脉之中,扑进高句丽的第一摇篮——五女山。五女山,史称鹘岭、五龙山、五余山、合罗城、老山城、纥升骨城、郁灵山城等,位于辽宁桓仁县城
城市道路交叉口中存在车辆掉头行驶的需求,不同的交通条件下所需的掉头设计方式不同。目前关于交叉口进口道掉头交通设计方法缺乏系统性的研究,尚未形成完善的相关理论研究成果。且在实际的工程设计过程中,设计人员往往是根据经验定性的进行掉头交通设计,缺乏定量依据。本文以具有左转专用车道和左转专用相位的城市道路交叉口进口道掉头交通流为研究对象,分析其基本运行特性及不同的掉头设计模式对交叉口内其他交通流的影响,进
企业社会工作的发展在我国有着广阔的成长空间,现在的企业社会工作发展和本土化发展遇到瓶颈有着多方面深层次的原因。近年以来,随着富士康等系列事件走进公众视野,劳资矛盾冲突
国有建筑企业或集体建筑企业经过产权制度改革后,国有和集体的资产全部转让或退出,改制后的民营企业正面临着企业可持续发展的问题。民营建筑企业如何继续保持持续稳定的发展
纺织服装产品脱毛已经成为质量投诉的热点问题,作者对产品脱毛的原因进行了分析,并对国内现行的检测方法进行了对比和梳理。
随着网络时代的到来,计算机技术的持续发展和移动智能终端的快速普及,不断催生着新的网络媒介形式诞生,其中以新浪微博为代表的微博媒介当属其中的佼佼者。自2009年新浪微博建站
注意是心理活动对一定事物的指向和集中,它是一种积极的心理活动。注意的实质在于对各种刺激作用的选择。注意的转移是根据新任务有意识地把一个对象转移到另一个对象上,它是注
为了总结出玉米高产平,衡施肥最佳方案,商水县农业局在多点进行了不同产量水平的旋肥数量、施肥的最佳时期及施肥方法等试验。一、配方施肥根据目前商水县土壤肥力状况和高产试
目的:通过对入院的脑卒中患者进行认知功能的评价,并给予有针对性的计算机辅助认知训练,探讨计算机辅助认知训练对脑卒中后认知功能障碍的康复效果。方法:对2012年7月-2013年