论文部分内容阅读
近来,随着数据库技术和海量存储器等硬件的快速发展,人们收集数据的能力得到了进一步的提高。面对信息时代海量数据的出现,如何有效地利用巨量的原始数据分析现状以预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术应运而生并得以迅猛发展,目前,数据挖掘已经成为一个研究热点。鉴于遗传算法在数据挖掘中优越性,本文主要做了如下工作:(1)首先介绍了数据挖掘的基本概念、原理,以及常用的数据挖掘算法和对这些常用算法的性能分析,紧接着介绍了遗传算法的基本概念和基本原理,以及经典遗传算法的基本流程和算法分析,为后续的工作提供理论依据和实验基础。(2)提出了一种基于改进遗传算法的聚类模式数据挖掘方法(IGAOC),以超市销售系统为背景,根据超市一段时间的销售情况,利用该算法对其数据库的信息进行聚类分析,从而预测出销售情况较好的商品类型,得到了一些潜在的具有应用价值的信息,并为超市的销售发展提供了一定的指导意义。实验表明,该算法收敛较K-means算法慢,算法的使用时间优于传统的K-means算法。(3)提出了一种基于免疫遗传算法的数据挖掘方法,就是在应用遗传算法进行数据挖掘的基础上,对遗传算法进行改进,引入免疫算子解决遗传算法中的“早熟”现象。利用该算法能够实现客户关系管理(CRM),以上述IGAOC方法挖掘得出的结果为例,因为对于很多同类型的商品来说,供货商肯定不止一家,该方法就是对同类型商品的供货商的基本信息数据库进行挖掘,计算出能使超市盈利最大的供货商,从而锁定这些客户,为超市赢取最大的利益。通过实验表明,该算法具有很强的鲁棒性和隐含并行性,能快速、有效地进行全局搜索,是处理大规模数据的有效方法,不仅克服了遗传算法的“早熟”现象,也大大提高了搜索效率。