基于量子遗传算法的K调和均值聚类算法的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:zmz28859330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来在信息决策领域较为活跃的热点课题。在数据挖掘的众多技术中,聚类分析尤为重要,它把数据对象分为若干类,让同一类中对象的相似性尽可能大,不同类间对象的相似性尽可能小,K调和均值聚类算法(KHM)是一种类似于k-means的聚类算法,属于划分聚类,该算法用数据点与所有聚类中心的距离的调和平均值替代了K-means算法中数据点与聚类中心的最小距离,成功地解决了K-means算法对初值敏感的问题。KHM实现简单,对初值不敏感,收敛速度快,但容易陷入局部最优值。遗传算法是一种高效的全局搜索方法,具有较强的鲁棒性和全局寻优能力。本文先将遗传算法跟K调和均值聚类算法相结合,互相取长补短,提出了一种新的算法:基于遗传算法的K调和均值聚类算法(GAKHM)。并通过实验验证了GAKHM具有较好的聚类效果。然后,针对GAKHM具有执行效率低,时间复杂度大等缺点,本文在GAKHM的基础上,引入量子算法,从而提出了基于量子遗传算法的K调和均值聚类算法(QGAKHM)。实验结果表明QGAKHM是一种执行效率高,聚类效果好的算法。本文的主要工作如下:首先,介绍了本文所需要的基础知识,主要有聚类分析,遗传算法和量子遗传算法相关知识。对它们的基本原理,优缺点进行了详细的分析。其次,针对遗传算法和K调和均值聚类算法的优缺点,提出了一种新算法:GAKHM。并从适应度函数的构造,染色体编码,选择算子,交叉算子,变异算子和K调和均值聚类算法的操作等方面对GAKHM进行详细的描述。实验结果表明GAKHM算法能够优化聚类中心,具有较好的聚类效果。最后,在GAKHM算法的基础上,引进量子算法,提出了QGAKHM。并详细介绍了K调和均值聚类算法,量子染色体编码,量子旋转门,适应度函数构造,量子变异,量子交叉等操作。最后通过实验验证了(QGAKHM算法的有效性及可行性。
其他文献
随着电子商务等互联网服务系统的不断发展,越来越多的用户数据、项目数据以及用户与项目之间的交互数据积累在其中。这些海量多样的数据使得用户浪费大量的时间去选择和过滤产
近几年,物联网技术获得了突飞猛进的发展,由于其独特的技术优势,在安防、电力、交通、物流、医疗、环保等领域得到了广泛应用,形成了一些新的产业链条,带来了巨大的经济价值。博物
膜计算是一个新的自然计算分支,它是从生物细胞、组织或器官的结构和细胞间相互协同工作的功能中抽象而来。进行膜计算的模型被称为膜系统或者P系统。根据不同的抽象来源,膜
如今信息技术飞速发展,软件系统不停地更新换代,各种新技术和新平台层出不穷。当一个系统的需求变更或者需要使用其它系统的功能时,就可能出现软件的重用的问题。在软件行业
信息科技大行其道的今天,电子表单已经逐渐取代纸质表单成为各单位和部门获取信息的重要工具。软件商们开发了无数基于web的信息系统,其中包含了大量的电子表单。传统的表单开
人机交互(Human Computer Interaction, HCI)技术在各个领域内,都占据了重要的地位。手势作为人机交互最直观、形象和生动的手段,理所当然地成为研究人机交互课题中的热点之一。
随着网络技术的飞速发展,个人和企业数据急剧膨胀,海量存储挑战愈加严峻。对于各类行业的用户而言,爆炸性增长的海量数据正如潮水般地冲击着他们的存储系统。特别是视频监控、高
GPU的迅速发展使其应用领域不断扩展。从最初的应用GPU进行绘图工作,到后来将其引入到高性能计算领域,再发展到使用multi-GPU以及GPU集群去进一步提高计算性能。其良好表现和
最近几年,社交网络如雨后春笋般快速发展,社交网络的开放性,互动性和娱乐性使得用户数量急剧增长,同时也伴随着大量恶意用户,这些用户对社交网络中正常用户是巨大威胁,研究社交网络
21世纪,这个伟大的信息化时代已经进入了第二个十年,随着我们互联网变得更加通畅,计算机多媒体技术正在加速发展,数字化视频相关的领域被不断地拓宽,人们对网络视频服务有着