论文部分内容阅读
多视角学习的目标是利用多视角数据在收集时运用的不同技术和方法,使得不同视角的数据之间具备统一性和互补性的特点,来提高分类模型的性能。近些年来,各种多视角算法被不断提出,尤其是具有坚实理论基础的基于SVM的多视角算法被广泛地研究和应用。然而,现有的这些多视角算法都具有同一个假设——各个视角在模型训练过程之中对于不同实例的重要性是相同的,在最终的融合步骤不同视角的决策函数也要进行平均的取值。实际上,不同的数据实例具有不同的特性,有一些实例更适用于一个视角描述,而另一些实例则倾向于被另一个视角的特征空间更好地表示。不同的实例针对不同的视角,具有不同的适应性,不同的视角信息对于不同实例的描述准确度也不同。已有的多视角算法均忽略了数据的这一特性。在本文中,提出了实例的视角向量的概念,它描述了不同视角对于特定实例的重要性,给出了每个实例有关不同视角的权重。视角向量是通过事先选取的多个分类器对数据进行训练和分类,并将结果进行统计计算得到的。接下来将视角向量与SVM模型相结合,将其分别应用在模型的训练阶段和测试阶段,由此构建了一个新的基于实例的多视角SVM模型。该模型与已有的多视角分类模型相比,它关注了每一个数据实例的特点,而不是将它们一概而论,视角向量在其中的应用使得该模型在训练时充分考虑了不同训练实例的不同视角特征所包含信息的重要程度,越是重要的视角信息,在训练模型过程中起到的作用越大,相反地,不重要的视角信息对模型训练的影响较小。基于实例的多视角模型在模型的分类阶段也将实例的视角向量与最终的结果融合过程相结合,使得向量分量值越大的视角,分类得出的结果所占权重越大,因为这样的视角对于该实例是更加准确和重要的。接下来本文又将视角向量应用于MVNPSVM算法,使其作用于分类结果的融合阶段,使得原有的MVNPSVM算法更加关注数据实例本身的特性,进一步提升了MVNPSVM的分类准确性。针对基于实例的多视角SVM模型和改进后的MVNPSVM算法,本文均利用了大量多视角数据集进行了充分的实验验证,并将新的算法与其他优秀的多视角模型进行对比,用实验结果证明了新算法的分类优越性。