结合密度思想的蚂蚁聚类算法

被引量 : 8次 | 上传用户:dragonfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为是数据库系统最重要的前沿之一,是信息产业最有前途的交叉学科。聚类分析是数据挖掘的一个重要研究领域。聚类分析的目的就是将数据库中的数据划分成具有一定意义的子类,使得不同子类中的数据尽可能不同,而同一子类中的数据尽可能相似。它在商业、生物、医学、地质、web文档等方面都有重要的应用,是当前的研究热点问题之一。 本文我们在仔细研究分析当前的聚类分析方法的基础上,把基于蚂蚁的聚类算法,与密度的聚类算法思想——“聚类是这样的区域,区域中的点的密度大于与之相邻的区域。”相结合,提出了基于密度思想的蚂蚁聚类算法。在该算法中,蚂蚁在二维网格空间中不断的搬运数据对象,比较它们之间的相似性,把相似性大的数据对象放到一起,不相似的数据对象移开,达到了聚类分析的结果,并把聚类结果作为K-Means的初始聚类中心,用K-Means算法对数据进一步进行聚类分析,加快算法的收敛性。同时,在一开始充分考虑数据集中数据对象本身的属性,使蚂蚁在搬运数据对象的过程中,避免一些不必要的移动,只把密度较低区域中的数据对象指定到相应的类中,使蚂蚁在搜索数据时具有启发性,提高了算法的效率。该算法还保持蚂蚁聚类算法的优点:利用蚂蚁算法的随机性,避免聚类分析过程陷入局部最优,初始中心由基于蚂蚁聚类算法得到,避免了K—Means等算法对初始值的敏感性的缺点。把基于密度的聚类思想运用到蚂蚁聚类算法中,是本文的创新点。 我们通过理论分析,和对一些数据进行实验,表明基于密度思想的蚂蚁聚类算法的运行时间大大优于原有的蚂蚁聚类算法,而且最后的聚类质量也达到了令人满意的效果。
其他文献
前言 1981年Parkman发现CD43表达异常与X连锁的隐性遗传病——Wiskott-Ablrich密切相关。1990年Ardman等在HIV-1感染的患者体内检测到抗CD43的自身抗体引起了人们对CD43的
刘向是中国历史上著名的目录学家、文学家、历史学家和思想家。他主要生活在西汉宣帝、元帝和成帝时期。这个时期,正是西汉王朝国势渐趋衰微的时期。宣帝时号称“中兴”,刘向也
“留白”是中国画的一种构图技巧,具体指在构图时,预留部分空间,不着笔墨,意在用黑与白、虚与实的强烈对比,吸引读者去思考作者创作的目的所在。“留白”艺术的产生与中国古代道家
随着科技的发展,传统工业正在经受着一场自动化和智能化的变革,柔性制造系统和自动化立体仓库被越来越多地应用于生产中。AGV(自动导引车)是随着自动化立体仓库的兴起而出现
在同种树脂体系及相同银粉含量下,加入不同比例的亚微米银粉,通过体积电阻率、接触电阻、剪切强度等测试,探究亚微米银粉对导电银胶性能的影响。
随着我国经济水平的发展、人民生活水平提高、饮食结构改变以及人口迅速老龄化,心血管疾病的发病率和死亡率迅速上升,对人们的生命健康安全造成了极大的威胁。人体的脉搏信号和
卫星导航信号模拟器通过载体运动轨迹的设定能够精确模拟出载体在所设定场景下收到的卫星导航信号。卫星导航信号模拟器可以对各式接收机的性能进行全面测试,其中包括捕获、跟
本文介绍了卫生瓷生产中采用压力喷釉和对釉浆性能的要求及特点,分析了影响釉浆性能的主要因素,并论证了羧甲基纤维素(CMC)应用于生产中应该注意的问题。
胃癌的常见转移部位为肝脏、腹腔内淋巴结、卵巢和脐部,肝脏是血行播散转移的常见部位,胃癌皮肤转移非常罕见。本文报告1例胃癌皮肤转移病人,并结合国内文献报道61例胃癌皮肤
随着足球运动不断发展、成熟,其整体运营机制更加成熟和完善。而足球运动较强的对抗性,使得整个开展过程中对足球运动员的体力等要求也更高。所以想要高效参与到一场足球比赛