基于多源在线行为数据的学生学业预警研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:skyaixiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络教育的逐渐兴起,教育数据挖掘旨在从网络上记录的大量数据中挖掘有价值的信息并帮助教育者制定更多人性化的教育决策。其中,利用数据挖掘技术预测学生的学业成绩并对存在学业风险的学生进行早期预警是最为基本且重要的环节。然而与之相关的研究还存在一些不足。现有的学业预警研究通常从单一课程数据源中获取学生学习行为的相关数据进行预测,忽略了学生整体的在线行为模式和外部环境特征对学生学业的影响。其次,由于通常存在学生群体中只包含极少数风险学生的情况,而已有风险学生检测模型对于这种不平衡数据情况研究较少。此外,虽然越来越多的深度模型被用于学业预警,但无法对所做出的预测进行合理解释和归因,因而不利于最终用户的理解和应用。本课题主要针对上述现有研究中存在的缺陷和不足进行了研究,主要的工作和创新点如下:(1)利用多源数据进行学生行为建模,提出了基于深度网络的序列化预测框架(Sequential Prediction based on Deep Network,SPDN)。该框架充分利用了课程在线平台记录和校园网络日志两类数据源,提取学生的在线学习行为和日常用网模式。通过多通道卷积网络结构合理融合多源数据并自动提取行为特征,并结合学生静态特征,利用长短期记忆网络对学生整体的在线行为进行建模,最终预测学生存在学业风险的概率。该模型在真实的高校课程数据集上进行实验,实验结果表明本课题提出的算法性能比基线对比算法表现更好。(2)针对在不平衡数据中检测极少数存在学业风险的学生的任务,提出了基于对抗网络的序列单分类模型(One-Class Sequence Classification with Adversarial Network,OC-SCAN)。该模型首先利用基于LSTM的自编码器从学生原始的在线行为序列中学习学生的表示形式。并单独利用非风险学生样本训练与常规GAN不同的boundary GAN模型的判别器来检测风险学生。在此基础上,提出了独立训练多个不同结构的自编码器优化集成框架en-OC-SCAN,进一步提高模型准确性和稳定性。通过在真实的高校课程数据集上进行实验,验证了所提算法在不平衡数据集中的性能高于其它单分类和二分类算法。(3)针对提高深度模型的可解释性并对风险学生进行归因分析的任务,提出了基于记忆网络的可解释模型(Interpretable Memory Network,IMNet)。该模型通过记忆网络模块捕获长期的行为模式,并且通过注意力机制发现与预测决策最相关的子序列段,使模型判断依据易被最终用户理解。通过在真实的高校课程数据上的实验表明,该方法可以有效预测有学业风险的学生并发现造成风险的潜在因素。
其他文献
近年来,随着经济与科技的不断发展,城市化建设速度越来越快,导致地面土地资源不断减少,地上空间建设费用上升,因此许多国家开始进行地下物流仓储中心的建设用来应对上述问题。在地下物流仓储中心工作过程中,对于叉车、集装箱等设备的位置信息获取至关重要,因此选择适合的设备定位技术十分有必要。通过研究现有的定位技术,WLAN定位在地下应用场景中的缺陷较小,且不存在架设成本及地形限制的影响,但在地下物流仓储中心环
相比于普通的低密度奇偶校验(LDPC)码,空间耦合LDPC码凭借着码字在空间上互相耦合的特殊结构,有着优秀的译码性能以及较低的译码复杂度。然而,在空间耦合LDPC码的两种传统译码方式中,要么存储资源需求过大,要么不适于并行计算。因此,本文以低存储量与并行计算为目标,对空间耦合LDPC码的译码方式进行研究,并且给出基于不同译码方式的译码器的现场可编程逻辑门阵列(FPGA)实现。第一,针对传统译码方式
物联网(Internetof Things)应用作为5G系统里的一个重要的应用场景,随着时代的发展将迎来近百亿的设备接入量增长、数据流量的爆炸式增长以及不断出现的新应用场景。但是由于物联网业务的空间地理区域复杂多样,因此卫星物联网(Satellite Internet of Things)作为6G网络的一个重要应用场景被提出服务于难以建立可靠的地面回程链路的位置区域。为了弥补卫星通信网络长时延、链
安全服务是维护软件安全和保护业务数据的重要组件,保障软件安全无论是在传统环境还是在云环境下都至关重要。随着云服务的广泛应用,安全问题频繁出现,但是传统安全服务并不适用于云环境。因此在云环境下如何部署、使用和管理安全服务逐渐成为了业内关注和探索的主题。本次课题针对云安全服务的部署、使用和管理问题,对国内外的软件定义安全(SDS,Software Defined Security)方案进行了对比分析。
网络技术的飞速发展与网络基础设施的广泛部署促进了社会数字化转型发展,海量数据的计算、传输和存储也推动了大型数据中心的建设与智能化升级转型。流量调度作为一种有效利用网络资源的技术,能够优化网络性能并帮助网络快速适应业务变革。而传统的数据中心架构以及流量调度方式已不能满足低延迟连接、高质量传输的需求。因此,本文主要研究了数据中心场景下基于软件定义网络架构的动态流智能调度机制。具体论文工作与研究内容如下
随着近年来互联网的高速发展和普及,本人所在的企业积累的数据量呈指数型增长,对于大数据分析技术的依赖性也越来越强。搭建大数据任务调度平台,为企业进行海量数据的提取、分析、落地及查询等工作提供一体化的解决方案,降低数据的管理成本,聚集数据、提供创建更完整的数据画像的基础条件,为企业深度挖掘数据中的潜在价值提供基础条件成为了该企业的刚需。一个完备的大数据任务调度平台,不仅需要该平台有强大的数据计算能力,
企业如何履行社会责任,一直以来都是社会关注的热点话题,尤其是这些年来,我国已经一跃成为全球第二大经济体,企业作为引领国家经济发展的强劲队伍,更是肩负了更多的社会责任。作为企业社会责任最重要的表现形式,企业慈善捐赠无疑备受理论界关注和重视。我国自古以来就有“助人为善”的优良传统,随着改革开放以来经济的飞速提高和经济实力的不断增强,我国的慈善事业也得到十足的发展。不断有企业认识到慈善捐赠不仅仅是纯粹的
随着我国城镇化进程的推进,大量人口走进城市,但城市的面积并没有随着城市人口的增长而等比例的扩增,城市绿化面积日益紧缺,城市的居住与生态环境不断恶化,人们日益增长的绿化需求与城市绿化面积稀少的矛盾逐渐凸显了出来。而室内绿化作为改善城市居民生活与居住环境的重要方式,对人体身心健康有诸多好处,为解决城市室内绿化推广过程中遇到的“没地方养”、“养护困难”和“养护成本高”的现实问题,本文设计并实现了一套基于
信息的生产者和消费者在信息过载时代都面临巨大的挑战,而推荐系统在引导用户探索其实际需求方面起着至关重要的作用。基于矩阵分解的协同过滤算法作为推荐系统中最具代表性的模型,其基本原理是利用用户的显式和隐式反馈行为进行物品推荐,在用户和物品之间的交互信息不足时,产生的推荐结果并不准确。随着传统零售和生活服务向在线平台的快速转移,应用平台积累了众多领域的评论文本和商品图片数据,这些异构信息极大地补充了稀疏