论文部分内容阅读
国民经济和社会信息化后,社会的运转就是软件的运转;社会的历史就是
数据的历史。数据挖掘技术是研究信息社会发展历史、推动信息社会更好运转
的重要技术保证。为了应对“信息泛滥”日益加剧的现状,利用群体智能算法
进行数据挖掘成为数据挖掘领域的一个新兴研究方向。
蚁群算法研究是受社会性昆虫蚂蚁行为的启发,对其行为进行模拟而产生
的一系列寻优问题的新思路。蚁群中的群体是指“一组相互之间可以进行直接
通信或者间接通信(通过改变局部环境),并且能够合作进行分布问题求解的主
体”。蚁群智能具有协作性、快速性、可靠性、分布性等优点,因此在没有集中
控制且不提供全局模型的前提下,在寻找复杂的大规模分布式问题的解决方案
中有着比其它算法更强的优势。
本文的主要研究工作在于:
1.研究分析数据挖掘的技术和应用现状,探求并论证蚁群算法在数据挖掘
中实现的可行性及意义,并进一步分析蚁群算法的研究和应用现状,为
论文研究确立方向和意义。
2.研究分析蚁群算法的基本理论方法和其在数据挖掘中的应用模型,为本
文中算法的实现和改进提供理论依据。
3.结合学生成绩系统的研究对于数据挖掘中的预处理工作进行分析,研究
如何对数据进行必要的清理、集成、变换和约简。在此基础上进一步探
讨属性的选择、降维和属性加权方法,以保证数据挖掘的效果。
4.对平阳职业教育中心的学生成绩系统的数据进行预处理,结合挖掘目标
创建学生成绩管理数据库,根据客户的需求建立挖掘空间,为蚁群算法
的实际应用提供平台。在此平台上应用数据挖掘蚁群算法实现关联规则
挖掘和分类规则挖掘,以供客户做更好的决策。为使算法更具有效性,
对于算法做进一步改进,并通过仿真实验验证改进后算法的更优的收敛
性。
5.在数据挖掘的基础上设计开发平阳职业教育中心的学生成绩管理系统,
强调在推进信息化的过程中,对于信息资源的深层挖掘应用的重要性以
及蚁群算法对于数据挖掘工作的重要意义。
最后,对进一步工作的方向进行了简要的讨论。
关键词:数据挖掘,蚁群算法,关联规则,分类规则,学生成绩管理系统