论文部分内容阅读
模式识别是从有限的观测样本获取可利用的数据或经验,以此概括特定问题世界的模型。它离不开数据分析的支持,因此,特征抽取也成为模式识别研究的最基本问题之一。随着数据处理方式以及描述角度的不同,同一模式通常由多种不同的特征表示。传统的维数约减方法,如主成分分析(PCA)和线性鉴别分析(LDA),主要针对单一的模式特征进行分析,它们不能反映同一模式的不同特性。因此,本文基于典型相关分析,主要研究多表示数据的联合相关投影,在保留多组特征有效鉴别信息的同时,消除特征间的冗余信息。结合半监督学习、分数阶嵌入以及协同表示等,本文探讨了有关思想在联合特征提取中的合理推广与拓展,致力于增强抽取特征的鉴别能力。本文的主要创新性工作和研究成果如下: (1)构建了协同概率标签(CPL)理论框架及其在单训练样本人脸识别中的应用。由于缺少对测试样本所包含的变化、噪声等进行统计、预测的有效信息,基于单个训练样本的人脸识别一直是人脸识别领域中最难的一个问题。因此,本文深入探讨了基于鲁棒的协同表示和概率空间模型的单样本人脸识别的研究工作。首先利用标签传播为扩展训练集中的类别提供概率标签,使得这些类的弱判别信息可以得到有效的利用;然后利用组稀疏表示的方法,自动判别测试样本对应的变换类型;最后创建一个新颖的基于重构的分类器,其中包含了每类单样本的一般训练集、每类多样本的扩展训练集以及扩展训练集中每个类别对应的弱监督信息。在多个人脸数据库上的实验结果表明,该方法具有良好的识别性能和鲁棒性。 (2)提出了双重结构一致性约束的相关传播投影(SCMCPP)。考虑传统典型相关分析(CCA)算法在面对半监督多表示数据时无法有效利用鉴别信息,而受限于带标签样本的不足,监督的典型相关分析算法往往会出现过拟合。本文开展了一项基于半监督多表示数据的联合鲁棒特征提取与融合算法的研究。与传统方法不同,本文的方法利用给定的少量监督信息来优化样本亲密度矩阵的构建,使得基于亲密度矩阵的标签传播更加可靠;采用迭代传播的思想,使得给定的监督信息和优先传播的可靠标签信息都可以在后续的亲密度矩阵更新和标签传播中得以利用;基于多视图结构一致性约束,联合使用软标签和硬标签传播,使得本文的方法在最大化置信标签信息的同时规避了错误标签传播带来的不利影响;通过构建概率组内和组问散布矩阵,将上述半监督模型扩展到多表示数据的联合维度约减中,SCMCPP能够为模式分类任务提供强有力的低维表示。 (3)提出了分数阶嵌入的监督典型相关分析理论框架。在现实应用中,由于噪声影响和训练样本不足,典型相关分析常常受限于基于训练样本的协方差矩阵估计大大偏离真实协方差矩阵的状况。针对这个问题以及提升特征鉴别能力的角度,本文在利用分数阶嵌入理论对协方差矩阵进行重新估计的同时引入了训练样本的鉴别信息。在引入分数阶理论之前,本文首先通过理论分析和实验分析阐述了分数阶嵌入的有效性;然后引入了分数阶嵌入的组内和组间散布矩阵;结合监督信息,构建了分数阶嵌入的广义典型相关分析(FEGCCA)和分数阶嵌入的判别典型相关分析(FEDCCA)理论框架。在手写体数字、人脸、物体识别中的实验结果表明,FEGCCA和FEDCCA能够为模式分类提供强有力的低维表示以及面对小样本问题的鲁棒性。 (4)建立了自适应补偿相关投影(ACCP)理论。我们分析之所以在面对小样本问题时,传统的典型相关分析所提取的特征总是缺乏鉴别能力,是因为噪声影响和有限的训练样本导致对类内变化估计的不足。为了解决这个问题,本文首先揭示了整体协方差矩阵和类内协方差矩阵的重构关系;通过构建自适应的组内和组间散布矩阵,我们提出了自适应补偿相关投影(ACCP)模型;作为自适应补偿的具体实现,基于扩展训练集的概率变化子空间(PVS)模型也被提出,用于估计一般训练集中样本所对应的自适应子空间。在多个数据集上的实验结果证实了ACCP的鉴别和泛化能力,尤其是处理小样本问题的有效性。 (5)提出了模态一致的判别多重集典型相关分析理论框架。多重集典型相关分析(MCCA)是典型相关分析在处理多于两组特征的多表示数据时的扩展方法。然而,传统的多重集典型相关分析及其拓展方法通常忽视了数据空间的结构信息。针对这个问题,本文首先引入样本的稀疏重构结构和鉴别信息,构建了稀疏判别的多重集典型相关(SDbMCC)模型。进一步的研究证明是样本间的协同表示结构而非l1范数的稀疏约束使得基于表示的分类器具有很强的鉴别能力。此外,考虑组间结构一致性约束和无监督的情况,本文进一步提出了模态一致的协同保持投影(C2PP)机制及其有监督的拓展,并在此基础上构建了模态一致的多重集典型相关投影(C2MCP)和模态一致的判别多重集典型相关投影(C2DMCP)。深入探讨了C2DMCP与MCCA以及SDbMCC方法的内在关系。大量的实验结果不仅验证了本文方法的有效性,而且揭示了它们能够为模式分类任务提供对噪声鲁棒的低维表示。