论文部分内容阅读
教育信息系统挖掘是当前数据挖掘的热点之一。如何从大量的教育信息中挖掘出有一定有意义的关联规则,用于研究学生的素质特征,指导学校加强素质教育工作就显得尤为迫切。关联规则是数据库中存在的一种重要的知识模式,关联规则挖掘算法已经得到广泛的重视和研究。其中,FP-growth算法是寻找数据库中频繁项集的经典算法。本文结合学生关系数据库数据挖掘的具体应用,对关系数据库的关联规则的挖掘的步骤和方法进行了探索。本人所做的主要工作如下:1.概述了数据挖掘应用和关联规则挖掘的基本理论和方法;2.在研究了FP-growth算法的基础上,给出了一种基于单链表的FP-growth改进算法FPS-growth算法,并在理论上和实验中了分析它在稠密数据集和稀疏数据集上的优越性;3.在学生素质测评系统中实现了关联规则挖掘。具体工作包括:应用实例的分析、从原始数据收集到数据的预处理的实现,以及关系数据库到事务数据库的转换;实现了利用FPS-growth寻找频繁项集、挖掘感兴趣的关联规则。最后用学生素质测评系统证实了FPS-growth系统的有效性。