论文部分内容阅读
特征抽取是模式识别中最基本的问题之一。抽取有效的鉴别特征是解决模式识别问题的关键。子空间分析方法因其计算简单、有效等特性在特征提取领域得到了广泛应用,其本质就是把原始的高维样本数据投影到一个更有利于分类的低维特征子空间。目前,绝大多数的子空间分析方法抽取的是对于模式最具鉴别力的特征。然而,这些特征对于分类器来说并不一定是最具鉴别力的。因此,分类器使用这些特征分类的时候性能会有损失。为了解决这个问题,该文从分类器的分类准则入手,提出了三种面向分类器的子空间分析方法以抽取对于分类器最具有鉴别性的特征,并将提出的算法应用于生物特征识别和手写数字体识别中。本文的工作和主要贡献集中在以下三个方面:(1)在线性回归分类器(LRC)的基础上,从LRC的重构策略和分类准则出发,分析了LRC在什么样的空间分类时效果最优。为了寻找这样的子空间,提出了重构鉴别分析(RDA)并将其应用于特征抽取。本文指出在高维空间中,RDA一般可以抽取N个特征(N为总训练样本个数)。同时还从理论上指出了RDA和线性鉴别分析(LDA)一样,也存在小样本问题,并给出了解决办法。在人脸识别和指关节识别中的实验和统计显著性测试表明,由于RDA是基于LRC的重构方法和分类准则而设计的,LRC在RDA子空间的分类性能和直接使用LRC在原始图像空间分类性能相比得到显著提高。而且RDA和LRC组成的识别系统显著地优于其他特征抽取算法和各种分类器的组合。(2)本文分析了基于稀疏表示的分类器(SRC)和LRC的分类准则,提出了最大化最近子空间边缘准则(MNSMC)。针对LRC在低维多样本(样本维数较低且数量较多)情况下无法使用的问题,用脊回归扩展了LRC,提出了脊回归分类器(RRC)。原始图像空间由于光照、噪声等因素影响,可能会使得类内重构误差大于类间重构误差,从而导致SRC和LRC的误分类。MNSMC从多子空间的角度,最小化同类最近子空间边缘的同时最大化异类最近子空间边缘,有效地解决了SRC和LRC误分类的问题。和RDA相比,MNSMC避免了小样本问题,同时可以抽取更多的特征。‘在人脸识别、指关节纹识别和手写数字体识别中的实验表明,MNSMC显著地提升了LRC和SRC的性能,而且MNSMC与LRC或者MNSMC与SRC组合的性能均优于其他特征抽取方法和分类器组合。(3)基于鉴别局部排列(DLA)和LRC的分类准则,提出了局部重构片排列(LRPA)。DLA算法是一种基于片(patch)的特征提取算法,通过局部最优和全局排列达到全局最优。然而该算法识别性能严重依赖于参数的选择,对参数的选取比较敏感。针对这个问题,LRPA用重构误差作为距离度量以代替欧氏距离,在考虑了LRC分类准则的基础上,最小化片内同类重构误差的同时最大化片内异类重构误差。在人脸识别、指关节纹识别和掌纹识别中的实验表明,LRPA与LRC组合对参数变化具有良好的鲁棒性,同时也比DLA得到了更好的识别效果。