论文部分内容阅读
随着互联网时代的到来,数据信息量剧增,人们需要从这些海量数据中提取出有价值的信息,这就涉及到数据挖掘技术。数据挖掘技术的应用领域十分广泛,主要包括顾客划分、模糊识别、趋势分析、金融投资、地理信息系统、图像处理和信息检索等领域。数据挖掘技术中最典型的方法是聚类分析,研究聚类分析的典型算法是K-means算法和模糊C均值(Fuzzy c-means,FCM)算法。由于传统的K-means算法和FCM算法对初始聚类中心的选取比较敏感,算法容易收敛于局部最优解,本文针对传统K-means算法和FCM算法的缺陷,利用粒子群算法可以调节解的局部最优和全局最优的特点,将粒子群算法分别与K-means算法和FCM算法相结合,并在此基础上对算法进行改进。 本文的创新研究主要体现在以下三方面。第一,本文将基于自适应飞行时间因子的粒子群算法与K-means算法相结合,并增加了粒子变异操作的方法,从而提出了一种基于改进粒子群算法K-means算法。改进的算法提高了K-means算法的全局收敛性,在一定程度上克服了算法对初始聚类中心敏感的问题。第二,本文针对FCM算法收敛速度慢,容易收敛于局部最优值的缺陷,提出了一种扩大的FCM算法。其次将扩大的FCM算法思想应用到软硬结合的FCM算法中,提出了一种基于粒子群算法的软硬FCM算法。提出的混合算法不仅能够达到全局收敛的效果而且具有较快的收敛速度。第三,本文将基于改进粒子群算法的K-means算法用在客户细分研究领域,通过数值试验比较,进一步证明了算法的有效性和收敛性。 论文对所提出的基于改进粒子群算法的K-means算法、扩大的FCM算法以及基于粒子群算法的软硬FCM算法分别做了相应的数值实验,数值实验证明了上述三种算法的可行性以及收敛性。最后论文对所做工作进行了总结,并提出进一步研究方向。