论文部分内容阅读
数据挖掘技术是在海量数据中提取有用信息的有效手段,为人们从大量数据中获取感兴趣的、有用的信息提供了便捷之路。数据挖掘技术在教育领域应用相对较少,学校多年来的教学和管理工作积累了大量的数据,目前这些数据只是一个待开发的“宝藏”,对学生信息、成绩等数据的处理还一般停留在简单的数据的备份和查询阶段。究其原因,近年来,学校招生人数逐年递增,给学校学生管理、教学工作带来了严峻的考验,传统的教学管理手段已逐渐不能适应社会的发展。本文对数据挖掘的过程、任务、方法和技术进行了阐述,对关联规则中经典的Apriori算法和分类算法中著名的决策树ID3算法进行了较深入的研究。并以青岛电子学校网上选修课平台为基础,着重介绍了Apriori算法和决策树ID3算法在数据分析系统中实施数据挖掘的全过程。第一章阐述了数据挖掘的研究背景和现状,提出了选题依据并分析了研究本课题的实用价值。第二章前半部分从数据挖掘的概念、挖掘的过程、任务、分类、常用技术和方法几个方面介绍了数据挖掘的相关理论知识。后半部分从ID3决策树算法和Apriori关联规则算法展开,探讨了数据挖掘的具体算法的理论知识。先以ID3决策树算法为重点,分析了如何在属性选择度量采用信息论的熵以及如何对决策树进行剪枝;再以学生购物问题为例引出了关联规则,介绍了关联规则中支持度和置信度的重要概念,并就Apriori算法进行阐述。第三章着重介绍数据挖掘在学生成绩分析系统中的设计与实现。根据所提出的实施方案,在数据预处理阶段做了大量的工作,设计的两个数据挖掘模型,完整地实现了数据分类挖掘的全过程:ID3决策树算法利用事后修剪法对决策树进行修剪,生成决策树用以分析影响学生成绩优良的因素,从而产生分类规则;Apriori关联规则算法总结出了课程之间的相互影响的关联规则,从中找出规律反馈给教学环节。第四章重点介绍了应用数据挖掘分类技术所开发的决策树分类系统。该分类系统具有数据文件访问、生成决策树、修剪决策树、产生分类规则、预测新数据的功能。第五章着重介绍了使用关联规则Apriori算法对学生评教数据进行挖掘的方法,经过确定挖掘对象、数据准备、数据挖掘、结果分析及知识同化几步操作,对挖掘的实施过程进行了分析,得到规则结论,总结出教学质量的好坏与哪些因素有关。通过有效的数据挖掘可以挖掘出很多意想不到的知识,从而会促进教学质量的进一步提高,科学地指导教学。本文的研究结论对实际的教学管理提出了很好的建议,给我校的教学管理工作又添上了新的内容,开拓了网络培训的新局面。随着数据挖掘的进一步发展,它在教学上的应用也就会越来越多,必将会给教学带来前所未有的收获和惊喜。