论文部分内容阅读
由于数据库中存在着大量数据,因此从数据库中发现有价值的信息显得十分重要。数据挖掘技术就是为解决这个问题而产生的。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域,但在教育领域中的应用并不广泛。高考牵动着无数考生和家长的心,是社会关注的热点。每年的高考结束后,相关的大量数据以存档备查为目的进行保存,年复一年的海量历史数据蕴涵着的潜在价值有待开启。当前网络化和信息化进程改变着人们的生活,考生和家长们已经不能满足于仅仅得到考生成绩、录取分数线等浮于数据表层的信息,他们更希望能够获得个性化的高质量信息服务。本文以数据仓库以及与之相关的联机分析处理和数据挖掘技术为数据分析手段,通过对高考历史数据的全面分析来构建新型的决策支持系统,从而在为社会提供高效、准确的高考决策支持方面做一些有意义的尝试和探索。论文运用了数据仓库的数据预处理技术和多维建模技术构建了一个以录取数据分析为主题的数据仓库,运用联机分析技术实现了数据的多维分析。同时,通过对数据挖掘技术中分类方法的研究,实现了高考志愿辅助填报的决策模块。分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。常用的分类方法有决策树分类、贝叶斯分类、神经网络分类等,其中决策树方法在可理解度、易训练性、易实施性和通用性等方面优于其他的分类方法。本文选择将决策树分类法应用到高考志愿填报研究中。根据所提出的实施方案,本文以志愿填报分析为例,完整地实现了数据分类挖掘的全过程,包括:确定数据挖掘对象及目标采集数据;采用数据集成、数据清理、数据转换、数据消减等数据预处理技术;使用ID3决策树算法生成决策树,并利用事后修剪法对决策树进行修剪;最后由决策树产生分类规则。完成了高考志愿填报决策树模型的建立。结论表明,基于数据仓库、联机分析处理和数据挖掘的高考决策支持系统具有一定的现实意义和比较广泛的应用前景。