论文部分内容阅读
数据分析一直是模式识别、机器学习领域中一个基本而又重要的研究问题。随着计算机技术的飞速发展,人们很容易获得大量无标签数据,但是对数据进行标记需要花费大量的人力和时间。因此,如何从少量有标签数据和大量无标签数据中学习出有用的知识已成为数据分析领域的一个研究重点和难点,半监督学习是一种有效的解决方案。基于图的半监督学习方法因其分类性能好、计算简单等优势已成为半监督学习领域的一种主流方法。本文从基于图的半监督学习方法入手展开研究,主要内容有:1.针对传统的半监督学习需要人工预先设定参数,导致自适应效果不好等问题,研究了基于非负低秩稀疏描述的自适应半监督学习算法(Non-negative Low Rank and Sparse graph for Adaptive Semi-supervised Learning,NLRS-ASL)。该算法在低秩表示的基础上增加了稀疏的约束,通过求解非负低秩稀疏表示模型,将边的选择及边权赋值两个步骤同时进行,且不需要人工参数干预,而且综合考虑了数据的全局和局部结构,然后利用图保持原则约束相似样本具有相似类别信息,从而使得判别效果更好。在ORL、Extended Yale B、PIE数据库上的实验结果表明所提算法具有较好的鲁棒性和分类准确率。2.基于稀疏描述的Fisher判别准则算法(Sparse Representation-based Fisher Discriminant Criterion,SRC-FDC)在有标签训练样本较少情况下,算法性能退化明显。对此,研究了基于稀疏描述的半监督判别分析算法(Sparse Representation-based Semi-supervised Discriminant Analysis,SRC-SDA)。相比SRC-FDC算法,该算法利用了半监督学习思想,在有标签训练样本较少情况下,结合无标签样本信息寻找一个更具有判别性的投影矩阵,从而使得算法鲁棒性更好。在COIL、Extended Yale B、PIE数据库上的实验结果验证了所提算法的有效性和可行性。