Chameleon聚类算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户：senjian

【摘要】

：

聚类问题是数据挖掘领域的重要研究课题,它不仅能用作独立工具来发现数据集的特征信息,而且能作为其他数据挖掘算法的预处理过程,因此,聚类算法的聚类性能具有极其重要的研究

【作者】

：

陈恒飞

【机构】

：

西安理工大学

【出处】

：

西安理工大学

【发表日期】

：

2017年期

【关键词】

：

Chameleon算法 K均值算法 Metis算法 DP聚类算法最小生成树

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类问题是数据挖掘领域的重要研究课题,它不仅能用作独立工具来发现数据集的特征信息,而且能作为其他数据挖掘算法的预处理过程,因此,聚类算法的聚类性能具有极其重要的研究价值。层次聚类算法是常用的聚类算法之一,层次聚类算法通常存在着静态模型选参与期望值相差巨大,或者模型不适于某些数据特性等缺点。Chameleon聚类算法是一种基本的凝聚层次聚类算法,依据自相似性构造动态模型。Chameleon聚类算法的主要优点是算法结构简单、快捷,而且能有效地处理大数据集,并且对数据特性要求较低。但是,Chameleon算法的聚类效果依赖于对KNN图的划分效果。本文针对Chameleon聚类算法的图划分方法-Metis算法进行研究,优化了图的划分效果,从而优化了最终聚类结果。最后利用改进后的算法对UCI数据集和人工数据集进行聚类,实验结果表明,改进算法聚类效果明显优于原算法及某些其他改进算法的聚类效果。本文的主要研究结果如下:1.改进了Chameleon算法。Chameleon算法是利用Metis算法完成图划分的,因而,聚类结果也随子簇的划分效果而改变,同时,在图划分的细化过程中,前一层的局部最优划分未必就是下一层的局部最优划分。本文利用改进的K均值聚类算法和DP聚类算法进行图划分,既能使聚类结果的稳定性得到提高,而且保持了子簇的高内聚性,也使得图划分过程与子簇合并过程中的迭代次数明显减少,时间复杂度明显降低。2.改进了 Metis算法。Metis算法依据随机匹配原则和递归二级划分法来完成对KNN图的粗化和初始划分步骤,容易使得相似度较大的点被分离,本文利用最大权重匹配原则和最小生成树法替换原方法,从而实现算法的粗化和初始划分过程,最大可能地将相似度较大的点划到一个子簇,提高了聚类效果。3.利用UCI数据集和二维人工数据集,对本文的改进算法进行了实证研究,研究结果表明本文的改进算法在聚类精度和运行效率方面都具有更好的效果。

其他文献

非线性Schrödinger方程的聚集峰的束缚态

在本文中，我们考虑以下非线性Schr(o)dinger方程-ε2△u+u=Q(x)|u|p-2u，x∈RN，u∈H1(RN)，其中ε是一个很小的正参数，N≥2，当N=2时，2＜p＜∞;当N≥3时，2＜p＜2N/N-2.我们证明:当ε充分小以及Q(

学位

非线性Schr(o)dinger方程束缚态变号解约化方法特定条件

离散时间单生过程首达时的可加泛函

离散时间单生过程是一类重要的马尔可夫过程（简称马氏过程），常被用于实际问题的建模，也被用于研究更为复杂的马氏过程，因此对单生过程的研究具有实际和理论意义。　　本文主要内容

学位

单生过程可加泛函遍历性中心极限定理泊松方程离散时间马尔可夫过程

基于帧间相关性的视频篡改检测方法研究

当今,随着数字信息处理能力的提高,人们能够以非常简便的方式获取数字信息。由于智能手机、摄像头等数字设备的广泛使用,越来越多的图片和视频都是由普通用户制作、编辑的,并

学位

被动取证视频帧间篡改检测视频帧内篡改检测GIST特征噪声特征

标准模型下可证明安全的IBE方案及其应用研究

基于身份的加密(IBE)体制是由Shamir在1984年提出的,它采用一个任意的且能够唯一标识用户身份的信息作为用户的公钥,而私钥则由可信的第三方PKG生成,这样就解决了传统公钥密

学位

密码学基于身份的加密可证明安全性电子投票电子邮件

弱型鞅空间上的鞅变换及拟范数鞅不等式

　　本文系统地研究了弱Hardy鞅空间、弱Orlicz鞅空间的鞅变换,即弱Hardy鞅空间与弱Hardy鞅空间的鞅变换以及弱Hardy鞅空间与弱Orlicz鞅空间的鞅变换。主要由以下六章构成：　

学位

弱Hardy鞅空间弱Orlicz鞅空间弱BMO空间鞅变换

新时期如何加强党性修养

新时期如何加强党性修养党性修养就是按照党性的要求（坚持党的性质、纲领、指导思想、宗旨等），通过学习、改进和锻炼，来磨砺自己的品格和意志，以保持政治上的坚定性和思想道德上的纯洁性。共产党员的党性，是由党的性质所决定的，它的基本点是确定不变的；同时，它又是不断运动着的客观实在，随着客观环境及党自身认识及经验的积累，党性在不同时期、不同条件下，其具体内容和重点又在不断变动、充实和提高。正如江泽民同志指

期刊

加强党性修养共产党员党的性质时代的要求自身认识指导思想思想道德时代要求历史客观实在客观环境具体内容保持先进与时俱江泽民过学习纯洁

三部件系统的可靠性研究

伴随着科技的发展，人们对可修产品的可靠性问题越来越关注，诸多专家学者已经对此进行了专门的研究，得到了很多有价值的文章。本文在前人的基础上，利用密度演化法和马尔可夫骨架过

学位

三部件系统可靠性问题密度演化法优先修理权

S1n+1中Ⅲ型全脐与半脐洛伦兹等参超曲面

众所周知，等参超曲面的问题是很重要的问题，而且分类问题解决，很多重要的结论可随即自然产生.　　本文借助运动方程研究了洛伦兹球面Sn+11（(c)Rn+21）中的n维Ⅲ型洛伦兹等参超曲

学位

洛伦兹球面洛伦兹超曲面等参超曲面完全分类运动方程

Chameleon聚类算法研究

其他学术论文