基于混合蛙跳的K-means聚类算法改进与应用研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:mingN78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今是一个科技高速发展、信息快速流通的社会,人与人之间的交流愈加密切,生活也愈加便利,各个领域都充斥着各种类型的数据信息。从这些数据之中提取有用信息,就需要分析这些数据。数据挖掘技术之中,聚类分析是分析工具的一种,并且一直受到数据挖掘领域的广泛关注,已经被应用于各个领域,包括图像识别、Web搜索、信息安全、商务智能等。K均值作为一种经典的聚类算法,是基于划分技术,具有原理容易理解、收敛速率快以及易于实现等优点,并且在对大规模数据处理过程中K均值聚类分析时效率比较高,因此在数据挖掘相关领域之中得到了较为广泛的运用。由于数据挖掘技术不断的创新发展,许多学者还将智能优化算法较好地应用到K均值之中。混合蛙跳算法是进化计算领域兴起的一种新型智能优化方法,其由于理论容易理解、调整参数较少、计算速率高、全局寻优能力强、易实现等优点,而被应用于多个领域之中并取得了喜人的研究成果,在人工智能领域中已经成为了热门和重点之一。本文针对K均值对于初始聚类中心的选择较为敏感、初始聚类中心选择的不同会造成差异较大的聚类效果等问题,提出了基于混合蛙跳算法的K均值的合并算法,具体工作如下:(1)简述了数据挖掘、聚类分析、K均值、混合蛙跳算法的相关概念,分析了两种算法的算法过程、相似性度量方法、优缺点等。(2)提出一种改进的混合蛙跳算法。对混合蛙跳算法引入了随机分组思想。随着种群每一次的迭代进化进行一次随机分组,来达到先小组寻优后种群寻优的目的。并且该算法通过引入惯性系数来调节局部寻优的移动步长,进一步防止了算法陷入局部最优解的可能性,提高了混合蛙跳算法的全局寻优的能力。(3)将改进后的混合蛙跳算法运用到改善后的K均值中,利用两种改进算法在数据集中各自寻优的优势,提高了原始算法的性能。本文选取所要聚类数据集中的每一条数据为一个青蛙,以簇内变差为目标函数,进行最优解的优化,最终使K均值在指定初始质心情况下进行聚类分析。(4)运用基于随机分组的混合蛙跳算法的K均值的改进算法对我国近二十年内的国内生产总值、老年抚养比、少儿抚养比、人口出生率以及人口死亡率五项指标进行了数据聚类分析,根据聚类结果对每一项指标进行相关性分析,从而进一步分析所选五项指标相互之间的相关性,结果表明该算法具有良好的应用前景。
其他文献
本文主要工作是设计并且实现了在多媒体联络系统(即新一代呼叫中心系统)当中的多模式高扩展的录制服务系统。针对的问题与场景是在呼叫中心系统当中用户与坐席通话时的录制需
目前,机器人同时定位与建图问题(SLAM)是移动机器人领域的一个重要研究方向,其目的主要是使机器人能够在未知环境下能够自主定位、记录自身运动轨迹并构建地图。SLAM是一个完
近年来,互联网技术的快速发展给汽车工业带来了革命性的变化。从1886年第一台汽车的发明起到今天,传统汽车产业的发展发生了不小的变革。伴随着汽车产量与保有量的提高,人们
本课题主要研究的是一类各向异性外尔半金属的电学性质。在外尔半金属的材料系统中,其低能准粒子的本征费米速度vF是一个通常远小于光速的材料参数。这些材料中的狄拉克锥可以相对于能量轴倾斜,有两种类型。其中,对于倾斜参数C小于费米速度VF,锥体倾斜不足(Ⅰ型);对于C>vF,为过度倾斜(Ⅱ型)。本文仅讨论Ⅰ型外尔半金属。在线性响应模型中,其带间光吸收部分纵向电导率的实部在2(1-2ξ)μ0处突然变化
目的:评价标准一、二线治疗失败后改良FOLFOXIRI方案对比其他系统化疗方案三线及以上治疗不可切除的转移性结直肠癌患者的疗效及安全性。方法:我们系统地搜索了从2011年01月至2019年06月杭州市第一人民医院和杭州市肿瘤医院的转移性结直肠癌患者。共59例患者纳入研究并接受了随访,其中试验组共20例患者后线应用了改良三药方案(m FOLFOXIRI/m XELOXIRI)(5-氟尿嘧啶/亚叶酸钙
随着信息技术的飞速发展和网络的普及,大量的高维数据在我们日常生活中变得随处可见,成为人们生活的重要组成部分。然而,由于数据维数过高,如何准确且快速的从高维数据中获得
网络技术与图像的快速发展,使得获取数据的途径越来越多样化,数字作品的出现为生活增添了便利,但也随之而来许多版权上的安全隐患。数字作品的非法复制,传播和公开以及数字作
随着物联网和图像传感器的发展,智能视频处理算法的应用和需求越来越多。目标跟踪是智能视频处理算法的重要环节,传统的目标跟踪算法往往致力于通过改进手动设计特征或优化机
车间调度问题一直是制造企业的研究热点,而近年来随着全球变暖和环境污染的增长,考虑绿色指标的车间调度问题,即车间绿色调度问题开始引起制造系统的关注,也逐渐成为学术研究
2004年石墨烯的发现打破了科学界对二维材料不可能稳定存在的认知局限,自此各种相关研究引起了人们的广泛关注。近年来,单一二维材料的性质已不再满足研究需求,人们逐渐将目光转至堆叠或无缝连接两种不同材料的二维晶体。我们选用两种不同的具有与石墨烯类似结构的单层过渡金属硫化物,一般可以被认为是石墨烯的带隙对应物,利用它们较小的晶格失配和完全相同的晶体结构以实现横向异质结并研究其谷极化输运性质。单层过渡金属