Chameleon聚类算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:senjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类问题是数据挖掘领域的重要研究课题,它不仅能用作独立工具来发现数据集的特征信息,而且能作为其他数据挖掘算法的预处理过程,因此,聚类算法的聚类性能具有极其重要的研究价值。层次聚类算法是常用的聚类算法之一,层次聚类算法通常存在着静态模型选参与期望值相差巨大,或者模型不适于某些数据特性等缺点。Chameleon聚类算法是一种基本的凝聚层次聚类算法,依据自相似性构造动态模型。Chameleon聚类算法的主要优点是算法结构简单、快捷,而且能有效地处理大数据集,并且对数据特性要求较低。但是,Chameleon算法的聚类效果依赖于对KNN图的划分效果。本文针对Chameleon聚类算法的图划分方法-Metis算法进行研究,优化了图的划分效果,从而优化了最终聚类结果。最后利用改进后的算法对UCI数据集和人工数据集进行聚类,实验结果表明,改进算法聚类效果明显优于原算法及某些其他改进算法的聚类效果。本文的主要研究结果如下:1.改进了Chameleon算法。Chameleon算法是利用Metis算法完成图划分的,因而,聚类结果也随子簇的划分效果而改变,同时,在图划分的细化过程中,前一层的局部最优划分未必就是下一层的局部最优划分。本文利用改进的K均值聚类算法和DP聚类算法进行图划分,既能使聚类结果的稳定性得到提高,而且保持了子簇的高内聚性,也使得图划分过程与子簇合并过程中的迭代次数明显减少,时间复杂度明显降低。2.改进了 Metis算法。Metis算法依据随机匹配原则和递归二级划分法来完成对KNN图的粗化和初始划分步骤,容易使得相似度较大的点被分离,本文利用最大权重匹配原则和最小生成树法替换原方法,从而实现算法的粗化和初始划分过程,最大可能地将相似度较大的点划到一个子簇,提高了聚类效果。3.利用UCI数据集和二维人工数据集,对本文的改进算法进行了实证研究,研究结果表明本文的改进算法在聚类精度和运行效率方面都具有更好的效果。
其他文献
在本文中,我们考虑以下非线性Schr(o)dinger方程-ε2△u+u=Q(x)|u|p-2u,x∈RN,u∈H1(RN),其中ε是一个很小的正参数,N≥2,当N=2时,2<p<∞;当N≥3时,2<p<2N/N-2.我们证明:当ε充分小以及Q(
离散时间单生过程是一类重要的马尔可夫过程(简称马氏过程),常被用于实际问题的建模,也被用于研究更为复杂的马氏过程,因此对单生过程的研究具有实际和理论意义。  本文主要内容
当今,随着数字信息处理能力的提高,人们能够以非常简便的方式获取数字信息。由于智能手机、摄像头等数字设备的广泛使用,越来越多的图片和视频都是由普通用户制作、编辑的,并
基于身份的加密(IBE)体制是由Shamir在1984年提出的,它采用一个任意的且能够唯一标识用户身份的信息作为用户的公钥,而私钥则由可信的第三方PKG生成,这样就解决了传统公钥密
  本文系统地研究了弱Hardy鞅空间、弱Orlicz鞅空间的鞅变换,即弱Hardy鞅空间与弱Hardy鞅空间的鞅变换以及弱Hardy鞅空间与弱Orlicz鞅空间的鞅变换。主要由以下六章构成:  
新时期如何加强党性修养 党性修养就是按照党性的要求(坚持党的性质、纲领、指导思想、宗旨等),通过学习、改进和锻炼,来磨砺自己的品格和意志,以保持政治上的坚定性和思想道德上的纯洁性。共产党员的党性,是由党的性质所决定的,它的基本点是确定不变的;同时,它又是不断运动着的客观实在,随着客观环境及党自身认识及经验的积累,党性在不同时期、不同条件下,其具体内容和重点又在不断变动、充实和提高。正如江泽民同志指
本文通过对荣华二采区10
伴随着科技的发展,人们对可修产品的可靠性问题越来越关注,诸多专家学者已经对此进行了专门的研究,得到了很多有价值的文章。本文在前人的基础上,利用密度演化法和马尔可夫骨架过
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
众所周知,等参超曲面的问题是很重要的问题,而且分类问题解决,很多重要的结论可随即自然产生.   本文借助运动方程研究了洛伦兹球面Sn+11((c)Rn+21)中的n维Ⅲ型洛伦兹等参超曲