百度文库用于改善学生数据结构成绩预测的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:pastleaves
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,教育的形式与方法均发生了巨大的变化,并产生了大量与教育相关的数据。同时,大数据处理技术的发展及数据挖掘领域的繁荣使得大数据时代逐渐到来。将数据挖掘技术应用于教育学领域被称为教育数据挖掘,简称EDM。EDM是一个交叉学科,涉及计算机科学、教育学、统计学等多个领域。成绩预测是EDM研究中较为经典的应用场景之一。目前的成绩预测研究主要基于智能教学系统和数字化教学软件等信息化教学平台,成果仅能用于分析特定系统,有较强的针对性,但通用性较弱。以此为背景,本文对学生访问网络的日志数据及其以往的教学信息进行数据分析和数据挖掘,从而预测他们数据结构课程能否及格。在前期研究中,根据学生访问各类网站的频次信息及高等数学成绩进行成绩预测,取得了一定的效果。此次研究中作者以此为基础,提取学生访问百度文库的时间及频次数据,并将其作为新的特征加入原数据集中,以期进一步提升预测效果。在进行百度文库访问时间提取时,通过仔细观察百度文库相关的网络日志,发现了百度文库访问状态转移模型,并以此为基础得到了一种可以较精确地估计访问时间的方法。接下来作者按文档类型统计了学生访问百度文库的频次信息,进而确定了与数据结构成绩最相关的7种文档类型。为了提高学生成绩预测的准确性,作者按一定的顺序将新特征加入到模型中。在进行特征组合时考虑了使用新特征及不使用新特征、采用粗略访问时间及精确访问时间、采用重点文档类型及非重点文档类型几种情况。研究同时表明,采用精确访问时间和重点文档类型能有效地提高预测的准确率。通过采用最优的特征组合,本文提出的方法将预测结果的特异性从52.94%提升到了70.59%,同时敏感性保持在了80%以上。最后,对全文进行了总结,同时提出了下一步的工作。研究发现,使用网络访问日志和以往的考试成绩进行成绩预测是可行的。本研究使用的数据集不依赖于某些特定的教学系统,因此具有较强的通用性,克服了当前大多数成绩预测研究的缺点,理论上该方法具有可移植性。
其他文献
为了获得可靠的、可信的、高质量的服务,对服务实施充分的、完全的测试是至关重要的。总体上看,目前的Web服务测试尚处在初级的阶段,研究人员主要通过传统的技术,在原有的测
随着Internet/Web 技术的快速普及和迅猛发展,Web 上信息总量日益膨胀。如何将用户所需信息从这个信息海洋中找到,并按照相关度从大到小排列并返回给用户变得日益迫切,搜索引擎
网格是一个集成的计算与资源环境,它能充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力,实现资源的全面共享。网格任务调度是网
乘务员排班优化问题广泛存在于航空、铁路及城市交通等多个领域,如何合理地进行乘务排班以减少运营中乘务费用支出和提高运营效益一直是交通运输公司面临的重要问题。对我国快
随着网络的普及,互联网应用正逐渐渗透到经济,社会,生活的各个领域,特别是搜索引擎技术的出现,促进了信息的整合。垂直搜索是针对某一个固定行业的专业搜索引擎,是搜索引擎的
随着地球资源的日益贫乏,太阳能作为一种“取之不尽,用之不竭”的安全、洁净的新能源,正在被更广泛地利用。本文为了开发出一套太阳能发电控制系统,使太阳能电池板自动跟着太
研究基因型和表型之间的关联是生物信息学的热点问题之一。复杂疾病是多个基因异常调控共同作用的结果,具有复杂的遗传模式。研究其致病的机理,不但要研究单个基因的功能和对生
随着人们对于生活舒适度和健康监测的关注度的提高,依托于无线传感网络技术的智能环境正在得到逐步深入的研究和日益广泛的应用,其兴起使得通过智能环境对老年人,小孩,病人等
随着互联网的迅速发展,信息量呈爆发式增长,人们能方便获取更多信息的同时,也被信息的海洋淹没,想要获取需要的信息变成一件越来越困难的事。个性化推荐系统能够帮助人们快速
Petri网是集图形化表示和数学理论于一体的建模语言,可以描述常见的顺序、选择、循环和并行等行为,广泛应用于并发分布式系统的建模、分析和验证。Petri网的语义可以划分为行为