论文部分内容阅读
人脸识别是人类非常重要的感知能力。随着计算机技术的发展,人类渴望赋予计算机理解情感、感知外部世界的能力,自动人脸识别技术的研究应运而生。人脸识别研究具有重大的理论意义和应用价值。人脸识别研究既可以促进心理学上对人类自身人脸识别机制的研究,也可以促进图像识别技术的研究,帮助实现人工智能。人脸识别技术广泛地应用在民用安防、公共安全、娱乐、客户服务等领域。由于人脸图像会受到光照、姿态等外部因素和表情、年龄等内部因素的影响,另外,有些人的人脸很相似。这些因素会增加人脸图像的类内差异性和类间相似性,给识别带来很大的困难。所以,人脸识别非常具有挑战性,现在的人脸识别技术水平还达不到很多应用的需求,需要进行持续的创新性研究。本文主要对人脸识别中的特征提取和识别问题进行了深入研究。它们是人脸识别系统的核心。在特征提取上,本文主要研究主流的相对系统的Gabor类特征和LBP (Local Binary Patterns)类特征,分析它们的优势和存在的问题,然后提出相应的改进型特征。在识别上,本文主要研究度量学习方法,提出了一个概率度量学习的框架和两种具体的度量学习算法。具体的研究工作如下:(1)针对Gabor类特征存在的特征提取速度过慢和特征维数过高的问题,本文提出了Gabor幅度模式直方图(Histogram of Gabor Magnitude Patterns, HGMP)特征。HGMP特征将Gabor滤波器组作为对图像点编码的码书,Gabor滤波过程即编码过程,滤波后只需进行简单的方向归一化和尺度非最大抑制处理。相比其它Gabor类特征的滤波加编码的处理方式,HGMP特征的滤波即编码的处理方式加快了特征提取速度,也降低了特征维数。在FERET和LFW库上的实验结果验证了HGMP特征的有效性。(2)在HGMP特征的基础上,本文提出了一种Log-Gabor幅度模式直方图(Histogram of Log-Gabor Magnitude Patterns, HLGMP)特征。HLGMP特征引入Log-Gabor滤波器组代替Gabor滤波器组作为码书,能保留更多的纹理细节,也能更灵活地设计码书。在FERET和LFW库上的实验结果表明,HLGMP特征在各种参数设置下的识别性能都比HGMP特征更好,并且在LFW库上的识别效果超过了其它比较特征。(3)本文研究发现LBP类特征广泛采用的局部差值描述子具有很强的相关性,会导致编码分布很不均匀,影响特征的区分性。针对该问题,本文提出了一种主局部二值模式(Principal Local Binary Patterns, PLBP)特征,通过对差值描述子进行PCA (Principal Component Analysis)变换,既保证了编码的均匀性,又可以利用更多的局部邻域信息,同时增强了编码的区分性和鲁棒性。在FERET和LFW人脸库上的实验结果表明,相对其它LBP类特征,PLBP特征的编码分布更均匀,对光照变化更鲁棒,取得了很好的识别效果。(4)本文研究发现LBP类特征采用的硬编码方法,会损失信息,并使得编码对噪声和光照变化很敏感。针对该问题,本文提出了一种基于概率的软编码方法。软编码引入了编码置信度,既提供了更多信息,又增强了重要图像点的影响,抑制了不稳定图像点的影响,从而使编码更具区分性和鲁棒性。在FERET和LFW人脸库上的实验结果表明,软编码相对硬编码提升了识别性能,尤其是在受光照影响的情况下,性能提升更明显。软编码PLBP特征在LFW库上的识别效果超过了其它同类特征。(5)本文从概率的角度研究度量学习问题,提出了一个概率度量学习框架。将度量与概率相对应,通过参数估计准则来建立优化问题。在概率度量学习框架下,本文提出了一种指数函数形式的概率假设,推出了EDML (Exponential Discriminant Metric Learning)和LiDML (Linear Discriminant Metric Learning)算法。通过引入先验概率假设,本文推出了正则化EDML算法(REDML)和正则化LiDML算法(RLDML),正则化可以解决概率估计的小样本问题,并抑制训练数据中噪声信息的影响,从而提升算法性能。REDML和RLDML算法的计算都很简单。在LFW库上的实验结果表明,RLDML和REDML算法都取得了很好的识别效果,结合LBP特征和本文提出的HLGMP特征和软编码PLBP特征,REDML算法在LFW库上的识别效果超过了其它比较的度量学习算法。