基于集成学习算法的学生成绩预测模型研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:onewxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学生成绩预测是教育数据挖掘中一个重要的研究对象。学生成绩也是学生综合素质评价当中的一项重要因素。因此,通过对学生成绩进行预测,可以及早将学习上存在问题的学生筛选出来。及时对这些学生做出相应的指导,这对教师的日常教学管理工作和学生获得良好的学业成果都非常重要。由于不同地域的学校在教学方式、学生习惯、软硬件水平等的不同,不同学校收集的数据在数据格式、数据种类和数据丰富度上有着明显的差异。学校在学生学业数据收集上的差异,致使相关研究使用的数据有较大的区别。当前学生成绩预测研究较少关注课程知识点数据与成绩间的关联,其适用性和拓展性较窄,不利于相关研究成果的实际运用。同时,现有的研究也较少关注时间序列因素对学生成绩预测的影响。针对上述问题,本文基于课程知识点与学生历史成绩数据集,提出了两种学生成绩预测模型。具体的研究内容如下:(1)利用课程的知识点信息、试卷考点信息和学生的历史考试记录构建学生考试的特征信息。构建能表现学生考试成绩变化趋势的特征字段,使模型能够捕获学生考试成绩的动态变化,增强模型在时序预测中的准确性。(2)基于注意力机制和长短期记忆网络,提出一种Att-LSTM成绩预测模型。注意力机制的引入,可以增强长短期记忆网络模型在大量输入特征数据中筛选出关键信息的能力,重点关注对学生成绩有较大影响的特征信息。实验结果表明,与单一的长短期记忆网络成绩预测模型比较,Att-LSTM模型能够降低各项指标上的误差。同时,本文还分析了学生考试成绩变化趋势特征字段对Att-LSTM模型预测结果的影响,结果表明趋势特征字段能够提升模型预测效果。(3)提出一种基于集成学习Stacking的多模型叠加学生成绩预测模型。该模型中包含两层学习模型,第一层由Light GBM、XGBoost以及Att-LSTM模型组成,第二层由回归算法组成。通过在前述的数据集上进行实验,实验结果分析表明在平均绝对误差、均方根误差和决定系数指标上,基于集成学习Stacking的多模型叠加学生成绩预测模型比单一成绩预测模型有更好的效果。本文研究表明基于课程知识点数据集的学生成绩预测研究具有很好的准确性。同时基于集成学习Stacking的多模型叠加学生成绩预测模型可以降低模型过拟合的风险,增强预测模型的泛化性能。
其他文献
总结了上海轨道交通架空刚性悬挂接触网线路在运营过程中常见的弓网异常磨耗现象,对出现的弓网异常磨耗情况进行系统分析,有针对性地提出了在工程实施中减少弓网磨耗的建议,包括优化架空刚性悬挂接触网平面布置设计、支持装置采用硅橡胶材质、提高检修质量、使用耐磨性强的接触线等改进措施。这些改进措施的实施,确保了弓网的安全运行。
本文从女性主义的角度探讨了《水浒传》的翻译问题。女性主义翻译作为翻译研究文化转向的产物,为典籍翻译中译者主体性研究开辟了一个全新的性别视角。这种研究修正了译者隐形的做法,突出了译者的性别身分地位,同时也是一种新的文化和意义的构建。
跨学科主题学习是《义务教育历史课程标准(2022年版)》的亮点与难点,是课程修订所强调的素养导向、综合性、实践性等理念的具体落实,为初中历史课程内容的拓展、教学方式和学习方式的转型明确了新的方向。研究认为,推行跨学科主题学习是课程教学发展的必然逻辑,体现出走向综合课程的方向和培育核心素养的要求。从课程层面看,跨学科主题学习具有两大重要特征:立足学科的课程内容综合化和基于真实情境的课程实施实践化;从
选取淮安市内区、县级城市的滨河步道,进行实地调研,了解滨河步道使用现状和使用者对滨河步道空间的使用需求,分析两者差距,归纳建成环境的主要矛盾与问题。针对滨河步道现存问题将“主动式健康”概念引入滨河步道设计中,提出基于“主动式健康”概念的滨河步道优化设计策略。
学位
针对当前雨水回用规模在地域性方面缺乏进一步的研究,以碳中和为背景,基于逐年降雨数据构建了一种有效降雨下的雨水回用效率分析体系。并且结合经济分析原理分析费用、效益以及单位雨水利用的净现值等,从雨水回用效率与建设项目投资效益最优化的角度研究总结出最经济合理的雨水回用设施建设规模。
文章分析了受电弓碳滑板磨耗机理,总结了碳滑板异常磨耗的几种主要表现,重点对碳滑板异常磨耗原因进行分析,并有针对性地提出一些解决碳滑板异常磨耗的措施。在国内一些地铁车辆项目上,采取这些措施已有效解决了一些碳滑板异常磨耗问题。
为使无人机遥感图像的影像残差值得到有效控制,提升多源遥感影像变化特征的检测精度水平,设计基于无人机倾斜摄影技术的多源遥感影像变化检测并行系统;在C/S框架体系中,设置并行运作电路、像素点检测主机、HBase存储结构与遥感影像显示器,完成对多源遥感影像变化检测并行系统的硬件设计;根据联合平差指标的数值水平,计算密集度指标,联合已知影像数据,求解无人机倾斜摄影过程中的纹理映射条件,实现对多源遥感影像的
无法表示意见反馈的信息往往不像其他审计报告意见类型那般明了,本文选取了23家上市公司2020年及2021年审计报告,对形成无法表示意见的基础事项及第二年的变化情况进行梳理,归纳总结主要涉及的事项特征及解决事项的方式,进而为审计人员识别这类事项风险提供参考。