论文部分内容阅读
目前,高等院校针对学生的管理工作开始多样化,但对学生在学习成绩上的关注始终没有减弱。为了学生让学生享受美好大学生活的同时,能更高标准的完成学业工作,关于评奖评优的促进工作必不可少,其中奖学金的评定和奖励工作在重大程度上起到推进“优等生”,拉近“后等生”的作用。但是,如今由于国家对教育的重视以及教育基础的提高,高等院校年年扩招,学生数量急剧上升,这样便积累了有关学生成绩等方面的大量数据。通常,学校的管理人员仅仅会对这些数据进行简单的存储,查询等工作,没有让它的作用得到体现,例如,对奖学金的成绩数据往往是评比获得奖学金的等级,统计人数等等,没有对获奖的因素进行分析。为了让这些“沉睡”的数据能够“苏醒”,本文提出了基于数据挖掘技术的奖学金分析的课题研究,去发现隐藏在这些数据背后的知识,提供给相关人员。首先,对课题研究的理论基础进行概述。扼要介绍有关数据挖掘技术的背景、步骤、任务、分类、方法等等。详细阐述了数据挖掘的方法,重点是确立了本课题研究选用决策树的分类的方法,为接下来的研究奠定了基础。其次,分析了决策树ID3算法。介绍ID3算法的原理以及描述方法,重点解释了算法的实现过程,算法关于本课题研究常会涉及的问题以及针对问题的改进方案,为本课题选择此算法的原因等等。最后,本文基于以上技术支持,深入对奖学金评定数据进行分析。确定研究对象,收集某高校近几年3个专业的奖学金成绩数据;对数据进行清理、预处理,包括数据的选取、删除、离散化等等;利用处理好的数据表,构造决策树,通过最终的决策树,对奖学金数据进行了全面的分析,得到有用的信息,提出相应的支持和帮助。