论文部分内容阅读
人脸识别是目前模式识别领域内一个重要的研究课题。在人脸识别中,有若干难题。其一是不同人的脸比较相似,而同一人的人脸由于表情光照等条件的影响导致差异比较大;其二是训练样本数据的维数过高,小样本问题引起信息不足,导致识别难度加大。如何设计能够解决这两个难题的分类器,是一个具有重要研究价值的问题。
本文阐述如何分别解决这两个问题。对于第一个问题,设计的分类器应该尽量最大化不同的人脸数据之间的不相似性(即类间距离),同时尽量最小化同一个人脸的不相似性(即类内距离)。从这个角度出发,可以利用线性判别分析来解决解决第一个问题。
对于第二个问题,由于样本太少,提供的信息不足以设计合理的分类器,因此我们需要提供额外的信息,以利于分类器的设计。从这个角度出发,可以利用正则化的框架来解决第二个问题。
本文首先介绍了判别分析和正则化的一些相关工作。然后从正则化的角度,我们提出正则化判别分析。正则化判别分析允许将更一般的先验信息引入到判别分析的框架中,从而可以同时解决上述两个难题。正则化判别分析的基本出发点是,分类器应该最小化经过先验信息正则化了的类内距离,同时最大化类间距离。进而,我们建立了一个统一的框架,阐明了正则化Fisher准则与正则化最大边界准则之间的密切联系。针对一般形式的先验信息,即正则项,我们给出了求解的方法,分析并证明了算法的收敛性。
具体到人脸识别这一有监督学习问题,分类器在训练样本上的分类结果应该尽可能正确,即经验损失较小。受相关研究的启发,在正则化判别分析中我们取正则项为经验损失,即基于经验损失的正则化判别分析。进而我们分析此方法的解,给出了关于参数选择的建议,以及针对该具体形式的算法。
考虑到目前很容易获取到视频格式的数据,我们研究图像集识别这一非线性问题。通过选取合适的特征表达以及核函数,我们设计了基于经验损失的核正则化判别分析。在几个数据库上的测试结果表明,我们的方法要优于其他方法,这也验证了我们框架的正确性及合理性。