基于引力和小类合并的FCM聚类算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lpp110894
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析涉及到统计学、数据挖掘、机器学习和图像处理等多个领域,人们对它研究热情日益高涨。在聚类算法中,基于模糊划分的模糊c均值算法(FCM)是一种重要的算法,它有着深厚的数学基础和完善的理论,但是它还存在一些不足之处,本文主要针对传统FCM算法进行分析,并在此基础上进行改进,具体研究内容如下:①针对传统FCM算法受离群点影响比较大这一不足之处,提出了基于引力的离群点识别方法,为后续的聚类步骤做准备。离群点的特征是稀疏、和其它大部分对象的距离比较远,而引力的大小是和物体的质量成正比,和物体间的距离平方成反比,因此经过引力计算之后,离群点的特征就更加明显,更容易将其识别出来。②针对传统FCM算法对初始聚类中心过于依赖的现象,提出了基于引力的选取办法。引力不仅考虑了对象间的距离关系还考虑了对象间的“质量”关系,数据集中某一对象的“质量”的具体含义就是指它ε?邻域中所包含的对象的个数。通过引力方法得到的初始聚类中心大多在簇的中心位置,不仅在一定程度上避免了因初始聚类中心选择不当而使算法陷入局部极值点,而且还减少了迭代优化的次数。③传统FCM算法中聚类个数c需要预先给定,这对没有经验的用户是比较困难的。为了解决这个问题,文中提出通过小类合并来获得最佳的聚类个数c。为了验证本文提出的改进算法的有效性和可行性,在论文的最后将其与传统的FCM算法在多个数据集上进行了对比实验,验证了改进算法不管是在聚类质量还是在聚类稳定性上都优于传统FCM算法,从而验证了本文提出的改进的FCM算法是有效的、可行的。
其他文献
无线Mesh网络(Wireless Mess Network)简称WMN,是一种新型的无线通信网络。它具备网状的拓扑结构的自组织性和自愈特点,并具有有效的移动用户管理和跟踪机制。无线mesh网络既
列车运行系统(TOS)是铁路智能系统(RITS)中的核心系统,也是典型的混杂系统。如何对TOS进行建模分析是RITS研究中的关键问题。由于TOS是一类强实时性的反应系统,其动态行为与
从《机器能思考吗》一文的发表开始,人工智能已经经历从专家系统到神经网络,再到今天统计学习理论几个阶段,这期间涌现了大量优秀的算法和理论。但我们也看到,在智能领域尤其
学位
随着“互联网+”概念的提出,计算机相关技术的应用逐渐与传统的行业结合在一起,为其在现代化的发展道路上创造了新的契机。然而在发展的过程中,传统行业的进步也对计算机技术
机器博弈是人工智能的一个重要研究领域,它在人工智能中的作用与果蝇在遗传学中的研究所起到的作用相似。机器博弈研究的大量成果已经被应用到很多实际的领域当中,如天气预报
随着视频编码技术、网络基础设施、信息家电以及消费电子的迅速发展,以视频内容为核心的流媒体服务已成为信息产业中最具发展前景的业务之一。基于典型的分布式系统Internet
决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行分组,使组内的数据相似性最大,组间相似度最
决策树算法是应用最广泛的机器学习算法之一,它基于一个无次序、无规则的样本数据集,试图从中提取出描述此样本数据集的数学模型。传统的决策树算法只能处理属性为离散值的样
在普适网格中移动设备作为资源被发现和管理是普适网格系统研究的重点之一。本文先提出了一种普适网格的系统结构,详细论述了移动设备作为资源在系统中被发现和管理的方法,分
自然界中存在的大量复杂系统都可以通过各种各样的网络进行描述。近年来,复杂网络的研究受到了越来越多的关注,并渗透到从自然科学到工程科学甚至社会科学的多个领域。研究所
学位