论文部分内容阅读
随着数据采集技术以及处理方式的不同,相同的模式不可避免地出现了许多不同的特征表示方式。对于同一模式来说,不同的特征表示反应了物体不同的特性,因此,基于多组特征参与的模式分类方法,不仅可以保留原各组特征的有效鉴别信息,而且还可以在一定程度上消除特征表示之间的冗余信息。然而线性与非线性特征抽取方法主要针对模式的一组特征进行处理,不适用于多特征表示数据的特征抽取与特征融合。多视图相关投影分析,包括典型相关分析、多重集典型相关分析与多重集整体典型相关分析,已广泛应用于多组特征间的融合与抽取,并在模式分类中取得了良好的实验结果。因此,本文以多特征表示数据为研究对象,深入研究了多视图相关投影分析的相关理论与算法,构建了五种行之有效的特征抽取与融合方法。所做的主要工作和研究成果如下: (1)提出了基于稀疏表示的正则化半监督判别典型相关分析(SrSDCC)。由于判别典型相关分析(DCCA)方法在训练样本不足的情况下,其组内协方差矩阵会产生估计不足的情况。针对此问题,本文提出了基于稀疏正则化的半监督判别典型相关分析,该方法同时使用了数据中的已标记样本与未标记样本,其中已标记样本用来最大化样本的类内相关以及最小化样本的类间相关,未标记样本用来反映数据的本质几何结构。通过人脸数据库上的详细实验比较,验证了本文所提方法在半监督分类问题中的可行性。 (2)本文提出了一种基于模糊隶属度的广义典型相关分析。通过采用模糊k近邻法计算隶属度来刻画样本与类中心点的近邻关系,在有效地利用样本类别信息的同时提高了算法的稳定性与鲁棒性。此外,面对图像识别中存在的大量非线性问题,在核技巧的基础上,提出了正定核隶属度的广义典型相关分析算法以及不定核隶属度的广义典型相关分析算法,从而提取数据的非线性特征。在人脸图像与手写体数字数据库上的实验结果表明,基于模糊隶属度的广义典型相关分析所抽取的特征在模式分类中具有较强的鉴别能力。 (3)提出了基于P-SSOR算法的多重集典型相关分析。多重集典型相关分析(MCCA)能够有效地抽取到多组特征间的相关特征,然而在求解过程中往往会遇到多元特征值问题,并且不能有效地求取其精确解,这在一定程度上限制了其在实践中的应用效果,因此,本文提出了基于幂-对称超松弛(P-SSOR)算法的多重集典型相关分析,即PssorMCC。在手写体数据库、目标与人脸数据库上的大量实验结果表明,本文所提方法取得了良好的识别性能。 (4)基于高维多表示数据的特征抽取问题,提出了基于边界的线性鉴别多重集典型相关分析算法。由于多重集典型相关分析(MCCA)仅仅考虑了多组数据间的相关性信息,不能有效地反映样本数据的几何与鉴别结构,因此为了解决这个问题,本文基于MFA的思想,提出了边界线性鉴别多重集典型相关分析(MLDMCC)方法。该方法融入了线性鉴别分析的鉴别信息,不仅揭示出多组数据间的相关信息,而且还有效地刻画了数据间的几何与鉴别结构。在人脸图像与目标数据库上的实验结果验证了MLDMCC方法的有效性。 (5)构建了多重集整体典型相关分析(MICCA)的拓展模型。MICCA是一种无监督的子空间学习方法,在其模型中并没有包含数据空间中的鉴别信息。从有利于模式分类的角度出发,本文首先给出了两种监督的多重集整体典型相关分析,即判别型多重集整体典型相关分析(DMICC)与广义多重集整体典型相关分析(GMICC)方法。此外,为了充分地揭示出原始数据在高维空间中的多种特性与几何结构信息,本文基于多核学习思想构建了多核多重集整体典型相关分析(MKMICCA)。由于MICCA算法在求解过程中存在更为复杂的广义多元特征值问题,本文基于多元特征值问题的求解方法,提出了一种新的迭代算法来求取其精确解。在不同的标准数据库上的实验结果表明,本文所提出的两种算法不仅取得了良好的识别性能,还明显优于其他相关的维数约减方法。