论文部分内容阅读
数据挖掘是目前信息科学领域最前沿的研究课题之一。应用数据挖掘技术可以发现一些隐藏在大量数据背后的、潜在的有用信息来预测事物的发展趋势,这些信息极大提高了决策支持的能力。关联规则是其中一个重要的研究方向,有着广泛的应用背景,已引起人们的普遍关注。其主要的研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的规律。
本文在数据挖掘研究和关联规则挖掘研究背景下,展开了对关联规则挖掘方法的研究及应用工作:
1.关联规则挖掘的典型算法是由RAgrawal等人提出的经典的Apriori算法。本文对Apriori算法作了全面的分析和指出了挖掘中的关键步骤,并针对Apriori算法在计算候选项目集的支持度时,每一个循环都要扫描整个数据库,使得挖掘效率较低这一缺陷,提出了一种新的关联规则的高效挖掘算法NewApriori。新算法根据支持度对事务数据库进行筛选删除操作,使得在计算候选集支持度时,所扫描的事务数据库比原来的事务数据库小,从而提高整个算法的效率;同时,采用了一种新的产生候选集Ck的算法,该算法避免了原有算法在产生Ck时,对频繁集Lk-1的多次扫描,提高了挖掘效率。
2.探讨了在改变最小支持度、最小可信度的情况下,不增加数据集时关联规则的快速更新问题。
3.将关联规则数据挖掘的方法运用到中职学校的教学管理中去。对教学评价数据和成绩管理系统中大量的数据进行数据挖掘,找到课堂教学效果与教师状态的关系问题、学生成绩与设置课程的合理性问题等的关联规则,从而为教学部门提供决策支持信息,促使更好地开展教学工作,提高教学质量和效果。