论文部分内容阅读
信息技术的迅猛发展使人们生产与收集的数据呈现出多视角特性,且单个视角所提供的信息具有不全面性、不充足性,为了更加精确地诠释研究对象,多视角学习技术应运而生。多视角学习的基本思想是将描述对象的不同视角通过测度学习、协同训练、潜变量子空间学习等方式有效融合,得到对象目标的更具判别性的描述,为解决图像检索,视频浓缩,文档分类等诸多领域中存在的“语义鸿沟”问题提供了新的思路和方法。基于数据的高维性、多维性、冗余性及潜在几何结构难以琢磨等特点,研究如何高效地利用各个特征之间的潜在关系,获得能有效诠释数据的高层语义特征,具有一定的理论研究意义和应用价值。基于共享子空间学习的多视角学习方法是指在保持原始数据本质结构不变的情况下,利用数据本身蕴含的潜在关联属性,试图从多个高维原始特征空间发现一个所有视角共享的低维子空间,从而极其有效地诠释原始数据,并在一定程度上解决“维数灾难”。针对图像检索等多个领域常出现的“语义鸿沟”问题,本文围绕"基于共享子空间学习的多视角学习方法及其应用研究"这一主线来开展,利用基于矩阵分解的共享子空间学习算法对多视角数据进行降维,根据是否存在先验知识,建立相应的多视角学习模型。具体分为以下两个方面:1)针对各个特征贡献不均以及内在关联属性利用不充分导致学习效率低等问题,提出了一种基于非负矩阵分解(NMF)的多视角共享子空间聚类算法。我们利用NMF将多个高维数据映射于一低维子空间,并对低维表示引入了一定的约束条件,获得了强鲁棒性的聚类结果。更具体地说,利用Co-regularization函数约束每对视角,以挖掘出各个视角间的互补信息。同时,认为同一数据点对应的每个视角在聚类过程中都应分配到一个类,因此要求各个视角对应的低维表示与共享表示尽可能的相关。2)针对实际中附带类标的数据以及学习过程中信息丢失严重等情况,提出了一种基于PAF(patch alignment framework)的多视角共享子空间分类算法。在设计分类器的过程中,我们充分利用数据的类标特征指导学习过程,并利用DLA模型(Discriminative Locality Alignment)将多个类标特征之间的联系投影于一低维子空间,以探索数据潜在的几何结构。由于,实际中的数据经常伴随着噪声,我们采用鲁棒度量(CIM)构建重构误差项以减少学习损失,并利用相似度矩阵刻画各个视角对应的低维表示与低维共享表示之间的关系。此外,利用各个数据点的合页损失函数测量分类误差,学习获得了具有强判别能力的分类超平面。