基于成对约束的聚类和降维算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:gjzd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,半监督学习因其卓越的性能逐渐受到模式识别和机器学习领域研究者的重视。半监督学习可利用的监督信息除了少量的标记样本外,还包括样本间的成对约束等其它信息。其中与样本标记相比,成对约束所含的信息较弱,因而更容易获取。本文主要针对基于成对约束的聚类和降维算法展开研究,所取得的主要研究成果如下:(1)在竞争Renyi熵和Shannon熵聚类算法的基础上,通过引入样本之间的成对约束信息,提出一种基于成对约束的半监督竞争熵聚类算法,在一系列国际标准数据集上的实验验证了该算法的有效性。(2)提出一种基于半监督降维的聚类算法,该算法首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类,实验结果表明由于在降维和聚类两个阶段中都利用了监督信息,算法的聚类性能得到很大提升。(3)把集成学习的思想引入半监督聚类,通过对成对约束进行划分,提出一种半监督投影聚类集成算法,进一步提高了算法的聚类性能,并且对集成算法的多样性进行了分析。(4)通过对图像的张量分析,提出一种张量图像上的半监督降维算法,在一系列人脸数据集上的实验表明该算法不但可以有效降低数据的维数,还可以保留图像中像素之间的局部信息。
其他文献
主题地图是一种良好的企业信息集成和检索工具。在传统主题地图信息集成中,查询语言TMQL能提供一定程度的智能化检索功能,但不能解决检索中出现的同义异形词或近义问题,并且
无线传感器网络作为一种新型的信息获取、数据处理的智能化嵌入式设备,正得到越来越广泛的使用,人们对无线传感器网络各方面的研究也成为目前学术界的研究热点。路由协议是无
图像识别技术研究的是试图让计算机拥有类人的智能,从存在干扰、噪声和杂乱的图像环境中辨别或提取有意义的目标和对象及其特征属性的能力。图像识别技术的研究意义重大,在医
应实验室项目的需求,本文设计实现了一个组网快速灵活,扩展性能良好,通信安全,接入手段多样化的语音通信系统。该系统中涉及到的主要技术是语音编解码技术。本文在比较了当前
模糊系统善于表达人的经验性知识,可以处理带模糊性的信息,这是神经网络做不到的;但另一方面模糊系统的规则和隶属函数等设计参数只能靠经验来选择,很难自动设计和调整,这是
近些年来,细胞自动机作为一个建模工具,由于本身丰富的特性,得到了研究者的广泛关注,而细胞自动机在模式分类领域的应用是一个新的研究方向。基于细胞自动机的分类算法的一个