论文部分内容阅读
近年来,半监督学习因其卓越的性能逐渐受到模式识别和机器学习领域研究者的重视。半监督学习可利用的监督信息除了少量的标记样本外,还包括样本间的成对约束等其它信息。其中与样本标记相比,成对约束所含的信息较弱,因而更容易获取。本文主要针对基于成对约束的聚类和降维算法展开研究,所取得的主要研究成果如下:(1)在竞争Renyi熵和Shannon熵聚类算法的基础上,通过引入样本之间的成对约束信息,提出一种基于成对约束的半监督竞争熵聚类算法,在一系列国际标准数据集上的实验验证了该算法的有效性。(2)提出一种基于半监督降维的聚类算法,该算法首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类,实验结果表明由于在降维和聚类两个阶段中都利用了监督信息,算法的聚类性能得到很大提升。(3)把集成学习的思想引入半监督聚类,通过对成对约束进行划分,提出一种半监督投影聚类集成算法,进一步提高了算法的聚类性能,并且对集成算法的多样性进行了分析。(4)通过对图像的张量分析,提出一种张量图像上的半监督降维算法,在一系列人脸数据集上的实验表明该算法不但可以有效降低数据的维数,还可以保留图像中像素之间的局部信息。