论文部分内容阅读
多视图数据从多个角度刻画同一物体,包含了比传统的单视图数据更加丰富的分类识别信息,因此近年来多视图学习技术成为了一个研究热点。不同视图数据往往存在一定的信息冗余,如何充分地从多视图数据中提取有用特征并且消除冗余是多视图学习技术的关键问题。针对该问题,本文对多视图学习技术进行了系统的研究,主要研究成果总结如下:一、提出了两个多视图鉴别分析方法,即组递归鉴别子空间学习(GRDSL)和不相关局部敏感多视图鉴别分析(ULSMDA)。GRDSL在数据层融合多视图数据,使用递归学习的方式将样本集分解成多个近似集和相应的差分集,并在每次递归的差分集中学习一个鉴别变换。GRDSL设计了递归终止准则以及投影向量选择规则,并能在理论上保证多个鉴别变换的正交性。通过自适应的递归学习过程,GRDSL可以从多视图数据中有效地学得充足的有用特征。ULSMDA联合学习了多个视图特定的投影变换,使得在投影空间中,原始近邻的同类样本相互聚集,而原始近邻的异类样本相互排斥。ULSMDA考虑了跨视图数据的一致性,并设计了不相关约束,用于减少变换间的冗余。ULSMDA充分地使用了多视图数据的局部结构信息用于不相关鉴别特征的学习。四个数据集上的实验结果表明了这两个方法的有效性。二、提出了三个多视图字典学习方法,即不相关多视图鉴别字典学习(UMD2L)、多视图低秩字典学习(MLDL)和多视图低秩共享结构化字典学习(MLS2DL)。通过使得字典原子与类别标记相对应,UMD2L从多视图数据中联合地学习多个结构化字典。UMD2L设计了不相关约束用于减少不同视图字典间的冗余。从增强字典鉴别能力以及消除冗余这两方面出发,UMD2L提升了多视图字典学习技术有用特征学习的能力。MLDL将低秩学习技术引入到多视图学习技术中,运用低秩矩阵恢复理论来解决噪声存在情况下的多视图字典学习问题。MLDL设计了结构化不相关约束,并为多视图字典学习技术提供了高效的基于联合表示的分类机制。MLDL为多视图字典学习技术提供了在噪声影响情况下充分学习有用特征的方案。MLS2DL关注视图间共享信息的挖掘,提出在学习多个视图特定的低秩结构化字典的同时对视图共享低秩结构化字典进行学习。MLS2DL为多视图字典学习技术提供了在消除视图间冗余信息的同时有效利用多视图有利相关性的方案。实验证明了相比于代表性的多视图子空间学习方法和多视图字典学习方法以及提出的GRDSL和ULSMDA方法,这三个方法可以获得更优的分类效果。三、提出了一个半监督多视图鉴别分析方法,即不相关半监督视图内和视图间流形鉴别学习(USI2MD)。USI2MD给出了半监督视图内和视图间流形鉴别学习机制,使用无标记样本的局部近邻结构,以及有标记样本视图内和视图间的鉴别信息来从多视图数据中提取特征。USI2MD设计了一个半监督不相关约束,用于减少半监督场景下不利的多视图特征相关性。USI2MD充分使用了视图内和视图间的有用信息用于半监督场景下不相关鉴别特征的学习。实验证实了该方法相对于代表性的半监督多视图子空间学习方法的有效性。