谱聚类算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:aa87850011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是机器学习的经典问题。聚类可以分为无监督聚类和半监督聚类,无监督聚类是通过抽取数据中“潜在”结构,将相似数据组成类或类的层次结构,不需要任何先验和假设。在现有的无监督聚类算法中,K-均值聚类作为一种基于中心的聚类算法,是最简单、使用最普遍的方法之一。它在紧凑的超球形分布的数据集合上有很好的性能,然而当数据结构是非凸的,或数据点彼此交叠严重时,K-均值算法往往会失效,而且算法利用迭代最优化方法寻找最优解,因而不能保证收敛到全局最优解。新近出现的一种无监督聚类算法—谱聚类算法克服了K-均值算法的缺点,具有识别非凸分布聚类的能力,适合于求解实际问题,而且实现简单,不会陷入局部最优解,且能避免数据的过高维数所造成的奇异性问题。本文基于谱聚类算法做了以下两方面的研究。1.提出了一种新的聚类算法--层次谱聚类算法。层次谱聚类算法融合了层次聚类算法较高的聚类正确率的优点,和谱聚类算法避免聚类过程中歪斜划分的优点。实验结果表明提出的层次谱聚类算法的聚类正确率比层次聚类算法、谱聚类算法的聚类正确率都要高,同时层次谱聚类算法与层次聚类算法相比又大大节省了计算时间。2.提出了一种基于最近邻传递的谱聚类算法。利用谱聚类的维数缩减特性获得数据在映射空间的分布,在此基础上利用最近邻传递聚类算法在映射空间中对样本进行聚类。该方法通过谱映射为后续的最近邻传递聚类提供低维而紧致的输入。而最近邻传递聚类算法具有快速收敛到全局最优并且对初始化不敏感的特性。对于MPEG-7图像库及其子图像库的聚类结果验证了最近邻传递谱聚类算法用于图像聚类的有效性。
其他文献
动力系统在经济学中应用广泛且占有重要的地位.反三角映射给出了两个经营者在同一经济领域中市场竞争的数学描述.然而,当市场上出现两个以上的经营者时,反三角映射就不能表达他
本文主要用模糊关系的迹来刻画模糊关系的一些性质.一方面,我们对Fodor的关于模糊关系的迹的一部分研究结果的条件进行弱化,给出了更为一般条件下的模糊关系性质的刻画.同时,我
期刊
Although casting is commonly used to process aluminum alloys, powder metallurgy remains a promising technique to develop aluminum based materials for structural
近年来,很多学者开始关注多智能体系统的协调控制和编队控制研究,其中编队控制一直是热门话题。在多智能体系统的编队控制中,已经取得很多成果,例如:根据系统个体间不同的连通情况
近年来,高光谱遥感技术发展显著,由于其具有较高的光谱分辨率,高光谱遥感已广泛应用于环境监测、目标侦察、伪装识别等重要领域。然而因为光谱成像仪的空间分辨率较低和地表的复杂多样性,多种物质(端元)的混合像元通常存在于高光谱遥感图像中。为了提高后续应用的精度,如何从混合像元中分解与提取各种地物光谱(端元)并求得其对应比例(丰度系数)至关重要。本文基于已知光谱库的线性光谱混合模型,充分利用高光谱数据的空间
随着计算机技术以及地震数据采集、处理、解释技术的快速发展,地震技术在油气勘探、开发工作中的重要性日益突出.利用地震技术对储层的预测已是油气勘探开发中一种重要技术手
Accurate home location is increasingly important for urban computing. Existing methods either rely on continuous(and expensive) Global Positioning System(GPS) d