论文部分内容阅读
随着信息技术与数据库技术的飞速发展,人们面对的数据量以惊人的速度增长,为了从中获取有价值的信息,更好的利用这些数据资源,提出了数据挖掘技术。目前,发展自统计学的聚类分析已成为数据挖掘领域中一个十分活跃的研究领域;而基于目标函数的模糊C-均值聚类方法是聚类研究中的一个热点。 本文详细介绍了数据挖掘技术,包括数据挖掘的概念,数据挖掘的功能,数据挖掘系统的分类,以及数据挖掘的主要应用领域和未来发展趋势;在此基础上对数据挖掘中的聚类分析加以详细地论述,介绍了数据挖掘中聚类分析的概念、聚类分析中的数据结构和数据类型,以及在实际应用中聚类分析的一般过程,并详细介绍了数据挖掘中的主要聚类算法及其分类;分别描述了C-均值聚类和模糊C-均值聚类算法,并对模糊C-均值聚类算法的过程进行了详细的研究和分析;运用阶段化聚类的思想对FCM算法的过程进行了改进,将整个聚类过程分为两个阶段,并对聚类的数目和聚类中心的初始化做了自适应处理,能够自动得到较好的初始参数;对于算法中隶属度矩阵和聚类中心的计算,我们采用了新的修正方法以加快收敛速度和提高聚类效果,并由此提出了模糊聚类的新算法。最后,对得到的新算法进行实验分析,获得了较好的结果。