论文部分内容阅读
数据挖掘技术可以从大量的数据中通过算法发现隐藏其中的未知信息,被广泛应用到各种数据分析任务中,然而教育数据挖掘领域的研究目前仍然很少.针对高校大学生成绩分析问题,研究了经典的数据挖掘算法的分类性能,包括支持向量机、多元自适应回归样条、K-最近邻、决策树和随机森林.基于随机森林算法的变量重要性度量,分析了软件工程专业特定的课程对于学生综合学习效果的影响和作用.在真实的大学生学习数据集上进行了实验,获得了一些有意义的发现.