人脸识别中的特征提取与度量学习算法研究

来源 :北京邮电大学 | 被引量 : 39次 | 上传用户:xsw2233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是人类非常重要的感知能力。随着计算机技术的发展,人类渴望赋予计算机理解情感、感知外部世界的能力,自动人脸识别技术的研究应运而生。人脸识别研究具有重大的理论意义和应用价值。人脸识别研究既可以促进心理学上对人类自身人脸识别机制的研究,也可以促进图像识别技术的研究,帮助实现人工智能。人脸识别技术广泛地应用在民用安防、公共安全、娱乐、客户服务等领域。由于人脸图像会受到光照、姿态等外部因素和表情、年龄等内部因素的影响,另外,有些人的人脸很相似。这些因素会增加人脸图像的类内差异性和类间相似性,给识别带来很大的困难。所以,人脸识别非常具有挑战性,现在的人脸识别技术水平还达不到很多应用的需求,需要进行持续的创新性研究。本文主要对人脸识别中的特征提取和识别问题进行了深入研究。它们是人脸识别系统的核心。在特征提取上,本文主要研究主流的相对系统的Gabor类特征和LBP (Local Binary Patterns)类特征,分析它们的优势和存在的问题,然后提出相应的改进型特征。在识别上,本文主要研究度量学习方法,提出了一个概率度量学习的框架和两种具体的度量学习算法。具体的研究工作如下:(1)针对Gabor类特征存在的特征提取速度过慢和特征维数过高的问题,本文提出了Gabor幅度模式直方图(Histogram of Gabor Magnitude Patterns, HGMP)特征。HGMP特征将Gabor滤波器组作为对图像点编码的码书,Gabor滤波过程即编码过程,滤波后只需进行简单的方向归一化和尺度非最大抑制处理。相比其它Gabor类特征的滤波加编码的处理方式,HGMP特征的滤波即编码的处理方式加快了特征提取速度,也降低了特征维数。在FERET和LFW库上的实验结果验证了HGMP特征的有效性。(2)在HGMP特征的基础上,本文提出了一种Log-Gabor幅度模式直方图(Histogram of Log-Gabor Magnitude Patterns, HLGMP)特征。HLGMP特征引入Log-Gabor滤波器组代替Gabor滤波器组作为码书,能保留更多的纹理细节,也能更灵活地设计码书。在FERET和LFW库上的实验结果表明,HLGMP特征在各种参数设置下的识别性能都比HGMP特征更好,并且在LFW库上的识别效果超过了其它比较特征。(3)本文研究发现LBP类特征广泛采用的局部差值描述子具有很强的相关性,会导致编码分布很不均匀,影响特征的区分性。针对该问题,本文提出了一种主局部二值模式(Principal Local Binary Patterns, PLBP)特征,通过对差值描述子进行PCA (Principal Component Analysis)变换,既保证了编码的均匀性,又可以利用更多的局部邻域信息,同时增强了编码的区分性和鲁棒性。在FERET和LFW人脸库上的实验结果表明,相对其它LBP类特征,PLBP特征的编码分布更均匀,对光照变化更鲁棒,取得了很好的识别效果。(4)本文研究发现LBP类特征采用的硬编码方法,会损失信息,并使得编码对噪声和光照变化很敏感。针对该问题,本文提出了一种基于概率的软编码方法。软编码引入了编码置信度,既提供了更多信息,又增强了重要图像点的影响,抑制了不稳定图像点的影响,从而使编码更具区分性和鲁棒性。在FERET和LFW人脸库上的实验结果表明,软编码相对硬编码提升了识别性能,尤其是在受光照影响的情况下,性能提升更明显。软编码PLBP特征在LFW库上的识别效果超过了其它同类特征。(5)本文从概率的角度研究度量学习问题,提出了一个概率度量学习框架。将度量与概率相对应,通过参数估计准则来建立优化问题。在概率度量学习框架下,本文提出了一种指数函数形式的概率假设,推出了EDML (Exponential Discriminant Metric Learning)和LiDML (Linear Discriminant Metric Learning)算法。通过引入先验概率假设,本文推出了正则化EDML算法(REDML)和正则化LiDML算法(RLDML),正则化可以解决概率估计的小样本问题,并抑制训练数据中噪声信息的影响,从而提升算法性能。REDML和RLDML算法的计算都很简单。在LFW库上的实验结果表明,RLDML和REDML算法都取得了很好的识别效果,结合LBP特征和本文提出的HLGMP特征和软编码PLBP特征,REDML算法在LFW库上的识别效果超过了其它比较的度量学习算法。
其他文献
在强调表面三维形貌测量重要性的基础上 ,介绍了利用扫描白光干涉法测量表面三维微观形貌的原理及三维轮廓仪测量系统的构成。通过给出的几个测量实例 ,反映了该三维轮廓仪的
随着世界经济危机向纵深发展,各国政府为了保护自己的经济体系纷纷出台了一系列带有明显贸易保护主义色彩的壁垒措施,国际标准壁垒等在国际贸易发展中正逐渐取代传统的非关税贸易壁垒,成为发达国家重要的贸易保护手段。面对愈演愈烈的新型壁垒,强化政府的公共管理者作用十分必要。  一、建立标准壁垒的预警机制  建立标准壁垒预警机制对于我国对外贸易健康发展意义重大,因为国际标准化机构和各国政府及其标准化机构经常对其
[摘要] 互联网是产生和传递多种体验的平台,因为它充分满足了人们自由化、个性化的消费需求。本文界定了基于第三方网络体验营销的概念与特征,并阐述了基于第三方网络体验营销策略框架的构建方法。  [关键词] 第三方网络 体验营销 模式    一、基于第三方网络体验营销的基本定义  体验,就是个体对某些刺激产生回应的个性化的感受。体验通常是由于直接观察或参与、与外界产生心理上的互动而形成的,是人们内在的个
摘要:虚拟现实技术能够模拟环境,建立多源信息融合的交互式三维动态视景和实体行为,具有沉浸性、交互性、想象性的特点。传统的动车组故障诊断教学多基于课本,缺乏生动形象场景,学生难以把握整体专业知识框架;教学资源匮乏,课堂多以教师枯燥无味讲授为主,无法交给学生,调动学生学习积极性。基于虚拟现实技术的动车组故障诊断教学可以提供动车组构造的虚拟仿真系统,三维构建动车组网络控制和故障诊断动态过程,使学生对故障
[摘要] 起始于美国的次贷危机硝烟依然未去,越演越烈,波及欧亚许多国家,2010年起欧洲国家也开始陷入危机,整个欧盟都受到债务危机困扰。此次次贷危机也将影响到中国经济的方方面面,这种影响尽管当前并未显现,但可能会大大改变中国的经济形势。鉴于此,本文对经济危机对中国经济的影响进行了探讨  [关键词] 经济危机 中国经济 影响    一、前言  2007年7月,美国次贷危机全面爆发。这场危机对全球银行
受国内这几年经济发展环境和沿海地区产业转型升级调整的影响,农民工回流特点更加明显和聚集。针对农民工回流潮下的农村养老问题,结合国内外理论与研究成果,对我国农民工回