基于变异粒子群的聚类算法研究

来源 :长沙理工大学 | 被引量 : 4次 | 上传用户:jialei2055000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘中,很多工作都集中在发现能够高效地对大数据库进行聚类分析的方法上。在现有的大量聚类算法中,尤其以K-means算法应用比较广泛。K-means算法以点为原型,能够实现球形数据的聚类。该算法思想简单,易于实现,而且运行速度快,内存消耗小,能有效地处理大数据集,但是K-means聚类算法存在一些缺点:只有在初始值确定的情况下,聚类结果才是唯一确定的;算法都是局部寻优算法,容易追寻目标函数而陷入局部最优解,而且算法在一定程度上依赖于初始分类的确定,如果初始分类严重地偏离全局最优分类时,算法很容易陷入局部极小值,得到一个局部最优解。另一方面由于PSO算法结构简单,运行速度快,所以也被大量地用于聚类算法中。因此本文在前人的基础上对算法进行了改进,把两种算法进行了有机的结合。所做的工作如下:1.用变异粒子群聚类挖掘完成聚类。首先分析了粒子群算法的缺点,将粒子变异引入粒子群算法,通过增加种群的多样性来克服早熟收敛现象;其次通过对惯性权重的调整提高了算法的精度和收敛速度;最后,将K-means算法和粒子群算法结合起来形成一种混合聚类算法。该算法有效地平衡了粒子群寻优过程中的探索和开发,从而保证了粒子群算法稳定且收敛到全局最优。2.用基于种群多样性的PSO聚类挖掘算法实现聚类。首先分析现有的描述种群多样性指标的缺点;其次将基于粒子群算法的变异操作和K-means算法结合到粒子群算法中;最后,通过内部空间特性对粒子进行适当的扰动。该算法既改善了粒子群算法的局部搜索能力,又通过增加种群的多样性,避免了算法出现早熟收敛现象。3.计算机仿真。使用VC-6.0工具对提出的算法进行模拟实现,并对提出的算法与现有的成果进行比较,分析算法的优劣性。
其他文献
随着国内金融市场的不断发展和完善,信用卡业务的增长为银行带来大量利润,信用卡客户的分析和研究也受到更多的重视。目前我国对客户价值的评价系统还比较简单,方法还比较单一,如
近年来,随着互联网+时代的来临,以及智能手机的普及,移动互联网越来越参与并辅助人们的生活。同时社会正面临严重的人口老龄化问题,日益增多的空巢老人数量,带来一系列的社会
随着经济发展,信息不对称、大量信息孤岛存在、客户数据无法统一等问题,增加了高科技企业信息管理工作的动态性和复杂性。本文从当前搜索引擎发展的背景和趋势出发,利用Microsof
传统的双语词汇词典,一般由人工整理、编辑,具有权威度高、词条质量高的特点,但是其编制需要花费大量的人力、物力和时间。与此同时,随着互联网的发展和社会的发展,各种各样
由通用机器组成的大规模集群作为并行计算的有效途径之一,广泛应用于科学及工程中的计算模拟、海量数据处理等复杂问题中。并行编程模型是并行计算及开发并行软件的基础,是决定
随着移动互联网的快速发展,随时随地进行网络在线阅读已经成为现实。特别是以起点中文为首的在线读物网站为阅读爱好者提供了数以百万计的网络原创文学读物,丰富了文学爱好者的
上世纪90年代以来,随着互联网的发展,电子商务在社会经济领域发展迅速,电子商务推动了商业、贸易、营销、金融、广告运输、教育等社会经济领域的创新,给企业带来许多新的机会。现
随着网络资源的爆炸式增长,“信息过载”,“信息迷向”等问题的出现,用户如何快速有效地获取信息,成为现今信息服务系统亟待解决的问题。传统的信息服务也逐渐向个性化信息服
随着XML已成为互联网上数据存储和信息交换领域事实上的标准,人们已经开始习惯使用XML文档来存储、管理Internet上的海量信息资源,因而Web也正逐步转化为一个庞大的XML文档数
移动机器人在野外执行军事侦察、抢险救灾、农林作业等任务时,准确、快速的地形分类是保证这些特定任务完成的关键。针对传统地形分类方法存在的一些问题与实际森林环境地形分