基于信息熵蚁群聚类的模糊C-均值算法的研究

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:yangsh1967
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的重要分支之一。近年来随着数据挖掘研究的深入,涌现出大量新的聚类算法,每种聚类算法都是针对某一应用领域,也各有其优缺点。在众多的聚类算法中,模糊C-均值算法是目前使用最为广泛的基于目标函数的模糊聚类算法。但是该算法仍然存在一些不足之处,例如其聚类结果受初始化影响较大,在迭代时容易陷入局部极小等。针对这种研究现状,本文主要从三个角度对模糊C-均值算法做了改进:(1)模糊C-均值算法与基于信息熵的蚁群算法的结合使用。先执行基于信息熵的蚁群算法得到聚类数目C和聚类中心。然后以此作为模糊C-均值算法的初始参数,进行迭代优化,既克服了模糊C-均值算法对初始化参数极为敏感的缺陷,又避免了陷入局部极小值。创新之处在于引入的不是标准的蚁群算法而是基于信息熵的蚁群算法。这一改进,改变了蚂蚁拾起或放下的规则,比较的是信息熵值的改变而不是概率,减少了算法执行的随机性。(2)提出了属性加权的思想。鉴于在实际应用中发现,对于含有多维属性的数据集,往往有些属性对数据的聚类影响较大,而有些属性则影响较小。属性的分布特征与数据的聚类有着不可忽视的作用,因此本文为每个属性赋予一个权重。随后基于这种思想,本文重新推导了模糊C-均值算法的目标函数、聚类中心和隶属度函数的迭代公式。(3)本文提出用一种Voronoi距离代替欧氏距离的方法来调整隶属度的计算公式,以此克服模糊C-均值算法的聚类结果易受噪声数据干扰的缺陷。采用欧氏距离只能发现球状的簇,改用Voronoi距离就可以形成任意形状的簇,更加符合实际效果。隶属度计算公式改用Voronoi距离以调节隶属度的值,使隶属度的值大的数据对象对聚类中心位置的影响增大,对于隶属度小的数据对象(噪声数据)则降低它们对聚类中心的影响,从而也减小了孤立点对聚类结果的影响。实验结果表明,改进后的算法无论是在时间性能,还是聚类结果的准确性、稳定性方面都取得了较好的效果。
其他文献
脱机手写汉字识别技术在近二十几年内的不断发展说明了两个事实:对文字识别技术的需求及其在技术上的可行性。但是手写汉字的形变问题一直是制约其发展的主要因素。本文针对
WSCN节点是无线传感器控制网络中用于实现终端数据采集、通信以及控制目标对象的关键性嵌入式部件。随着物联网的快速发展,WSCN节点程序的在线维护与功能升级已经成为无线传
随着计算机软件技术的发展,并伴随着异构的网络环境、多样化的用户需求、灵活的业务模式、复杂的业务流程、众多的组织机构及层次、角色分工等问题,越来越多的企业通过Web建
学位
随着计算机网络的发展与普及,人们的工作、生活环境得到了较大的改善,互联网提供了更加便捷的工作方式,让生活变得更加轻松。然而,事物总有它的另一面,脆弱的网络往往被黑客
通过显著目标检测可以得到图像中引人注目的目标。显著目标检测技术可应用于图片浏览、图像剪切、图像压缩、基于内容的图像检索等领域。目前绝大部分关于显著目标检测的研究
近年来,随着用户对网络可移动性的要求越来越高,Mesh网络走入了越来越多人们的生活。然而在Mesh网络中,所有的通信都是基于开放的无线“连接”,所以Mesh网络的安全协议成为人
在形式语言和自动机理论[1]中,有限自动机和它接收的正则语言已经应用到各个方面,但是有限自动机只能接收正则语言的限制,使得有必要把传统的有限自动机进行推广,用半环[2]-[
在一些基于社交网络的电商平台上,例如ThisNext和Epinions,一个买家可以在社交网络中同其他买家分享他/她的商品评价。如果一个买家提供了高质量的评价信息,他/她就能够影响大量
随着我国数字家庭和数字电视产业的快速发展,数字图像/视频显示呈现大尺寸、高清化趋势,大量的标清电视信号需要转换为高清数字信号,因而由低分辨率图像获取高分辨率图像的高
学位
本文主要研究了视频图像序列光流的运动估计及匹配应用问题,它是计算机智能化的一个基本问题,也是动态图像分析的核心问题。图像系列光流运动估计是快速而准确地检测图像系列帧