学习分析技术中数据挖掘的应用研究

来源 :信息化建设 | 被引量 : 0次 | 上传用户:coolsun070279
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据时代的到来,对数据挖掘技术的应用提出了更高要求。首届“学习分析技术与知识国际会议”的召开,将数据挖掘方法与学习管理系统建立关联,并从分析学习者的行为中来改善和提升物理教育效率。本文将从数据挖掘的方法、内容、方向、结果呈现等方面,就其在学习分析中的应用展开探讨,并从优化数据挖掘方法上来改善学习分析技术的有效应用。
  关键词:数据挖掘 学习分析 关键技术 应用探讨
  基金项目:本文系河南省软科学研究计划项目(项目编号:142400410263,142400410267,142400410671)”的阶段性研究成果。
  大数据时代下信息指数型增长已经成为趋势,对于海量数据的分析及呈现,迫切需要从数据挖掘技術的应用中来获取有效信息。现代教育领域中对信息化技术的应用较为广泛,各类虚拟学习环境的构建需要符合学生的学习特性,这些数据即多又杂,更需要专门的软件工具来进行改善和处理。可以说,学习分析技术是数据分析及数据挖掘技术基础上发展而来的应用,因此,从学习分析定义及数据模型的构建上来增强对学生学习行为的研究,有助于科学的评估和预测学生的表现,改善学生的学习方式。虚拟技术中的学习环境的营造,可以通过数据挖掘技术来实现,特别是对于海量教育数据的有效提取,以帮助教育者进行分析和改进教学决策。
  1 学习分析中的关键技术
  1.1聚类技术
  对于数据挖掘中的聚类,主要从抽象对象的集合分组中来进行归类,聚类是对具有相似特性的多个类或簇进行分组的过程,并利用显性或隐性方式进行描述。在聚类分析中,不同算法下对相关数据的分类集合也是不同的,因此需要结合数据特征来进行有效的聚类操作。在虚拟学习环境中,对于每门课程知识的建构,可以从学生的不同表现上来进行分组聚类。如对于学习积极性高的团体,可以从增强知识拓展及关联度上来满足学生学习要求;对于成绩较低、参与度不高的学生,可以从激励措施的组建上来增强学生的学习积极性。可见,对于聚类技术的运用,关键是要从学生学情的分组上,融入不同的虚拟分组策略,以激发学生能够更好的参与学校,增进小组间学习的交流和协作。
  1.2关联规则的挖掘
  从大数据环境中对相关联数据的挖掘,主要是通过数据库中各项集的可信度、支持度的取值来进行。对于某数据库来说,利用形式化语言进行描述时,每一个事务都是集合,而每个集合都是M项,X、Y是其中的两项,其关联规则表示为X[?]Y的蕴含式。对于数据库中的各个事务规则来说,其所占的总事务百分比就是该规则的可信度。可见,对于关联规则的挖掘主要是通过对数据库的事务间的关系进行关联。在虚拟网络环境下,对于各类关联规则的挖掘,有助于我们从学生的学习行为中来挖掘关联关系,对于这些关联关系进行关注,从中来转变和调整教学策略,增强学生对知识的学习融合度,更好的提升教学效率。为此,可以通过对课程资源进行关联规则挖掘,通过学生访问量,以及学生的学习成绩进行对比,从中发现成绩与那些资源的访问有关系,并从学习资源的重组中来增强学生的访问量。如对于某些访问量不高的资源,在与学生的成绩关联上作用不大,可以进行有选择性的删除,避免占用学生的学习时间,也提升了资源整合的效率。
  1.3分类算法
  对于数据挖掘中的数据分类是基于某一共同特性而建立的数据分组,其分类方法可以是基于学生的某类学习行为,也可以是针对某一个体或群体。以决策树为例,对于分类方法的运用主要从分类规则的设定中,以判断各决策树的结构是否健壮,对于分类对象的属性定义是否准确,能否加快决策树的访问速度。对于学习行为进行分析时,分类算法可以预测学生的学习成绩,并从中来关联学习动机。如针对学习积极性较低的学生,可以从补救措施的激励上来增进参与度。对于决策树在构建分层教学模型中,依据决策树的层次关系来优化教学内容,能够更好的促进分层教学效率。同时,对于决策树的D3算法分类,可以从学生数据库进行学习能力分类,便于教师采取相应对策来改善学生的学习态度。
  1.4时间序列分析
  对于学习环境中的学生学习状态的分析是实时的,其产生的数据量也是按照时间序列进行排列的。因此,在进行学习行为分析时,可以从时间序列来动态的收集学生信息,及时发现学习行为中的问题,并灵活调整教学资源来优化虚拟教学。时间序列是数据挖掘中的重要技术,如在学生课程资源的挖掘中,能够结合访问时间、教育资源的关键词进行检索,以分析学习者的学习行为及趋势,通过反馈来重新编排和优化教学内容,提升教学资源的利用率。如在时间序列分析中可以完成练习作业的布置,结合学习者对相关课程的跟踪数据,从而明确练习的重点。在Moodle平台上,借助于对学习者行为数据的挖掘与分析,可以预测学生对某类知识的掌握程度,从而有针对性的开展作业辅导。另外,在对系统进行检测时,可以利用前馈神经网络(FFNN)、支持向量机技术(SVM)、概率集合SFAM分类器来进行准确分类,提升时间序列的分析优势。
  2 基于用户的学习分析技术实践
  基于学习管理的各类分析工具的应用,对于提升高等教育,尤其是远程教育改革中发挥了重要作用。以某院校网络教学为例,通过对各指标数据的分类挖掘,如“上网人数”、“登陆次数”、“在线时长”、“浏览资源次数”、“论坛发帖总数”等有关学习行为的汇总,来反映学生网络学习的频度、进度、以及均衡性,并从组织、引导和改进上来优化网络资源结构,跟踪学生的学习行为。通过数据挖掘技术在学习分析中的应用,能够从教学上获取各类活动的总量及平均情况,以监测网络学习工作现状,为教学评估和网络教学实施提供参考。
  2.1 课程资源浏览情况分析
  结合《开放教育学习指南》要求,对于网络课程模块的监测与分析结果中,能够清晰的反映各类资源浏览的页面个数、各学习者对各模块及内容的关注程度;如对于浏览频次较高的资源页面,表明受到学习者的关注。在课程章节设计、体验区,问题库、以及资料库等模块使用分析中,学生的学习习惯能够从其参与度、个人人均浏览频次等参数中来获得。如对于各章节内的资源访问量较高,说明学生从课程的学习及体验需求较高,学习者在模拟的体验区能够参与到网络互动,激发学习兴趣;对于问题库的访问量也较大,说明学生能够从常见问题的解答中来释疑解惑,便于学习者尽快掌握网络学习方法。   2.2 自主学习路径分析
  对于学习过程静态信息的获取,可以帮助我们从中来梳理学生的“自主学习路径”。以聚类算法为例,通过对网络资源模块的访问跳转进行分析,以“浏览时间+学号”作为键值,以“浏览顺序”为序列,以“浏览模块”为预测值来建构挖掘结构,从中来获得各模块信息的转换情况,从中来获得学习者的自主学习路径。如在“课程章节”与“体验区”模块的对比分析中,学习者的跳转访问概率较低,而在“资料库”与“问题库”等辅助模块中,学习者的跳转概率较大,说明学生对学习方法的了解较为侧重,也为我们进一步优化课程链接,拓宽学习资源提出了要求。
  3 结语
  随着对数據挖掘领域的研究深入,对于计算机技术与心理学、教育学的知识的融合更加紧密,因此从数据挖掘的专业化上,依据现代专门教育理论,从学习分析的心理认知、行为认知中进行阐释将会成为主流。同时,对于现有数据挖掘交互信息的分类,一方面从课程资源的访问上来探索学习规律,另一方面从学生认知、社会层面来对学生的学习行为进行跟踪和提取,加深对其剖析,揭示隐藏的知识信息以改善教育决策。另外,在数据挖掘个性化上,对于传统的依据学生行为的分析,难以从总体情况上来提升教学决策参考,而Siemens教授从构建学习者模型视角,分析学习者的学习过程,从中来获取某一类学生的特征值,以提供个性化的教学服务。对于学习分析技术中的数据挖掘运用,重在从数据误解方法上来提升教育资源的针对性、可操作性和灵活性,满足各类学生的不同需求。
  参考文献:
  [1] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J]. 现代教育技术. 2013(02).
  [2] 魏雪峰,宋灵青.学习分析:更好地理解学生个性化学习过程——访谈学习分析研究专家George Siemens教授[J]. 中国电化教育. 2013(09).
  [3] 孙洪涛. 学习分析视角下的远程教学交互分析案例研究[J]. 中国电化教育. 2012(11).
  [4] 吴青,罗儒国.学习分析:从源起到实践与研究[J]. 开放教育研究. 2015(01).
  [5] 胡艺龄,顾小清,赵春.在线学习行为分析建模及挖掘[J]. 开放教育研究. 2014(02).
  作者简介:杨凤霞,女,河南开封人,1979年3月生,讲师,硕士研究生,研究方向:计算机应用,云计算。
其他文献
摘要:随着社会经济的不断发展,计算机技术也在飞速的发展,而且计算机的应用也极为广泛,为很多领域做出一定的贡献。但是,在计算机日常使用中,经常会出现计算机故障,影响到计算机的正常运行,甚至会造成数据的丢失等现象,因此,必须要做好计算机的故障诊断工作,这样才能更好的保证计算机的稳定运行。  关键词:计算机;日常维护;故障诊断;显示系统;硬盘  1 计算机的日常维护探析  1.1 合理做好计算机硬盘的分
摘要:本文主要对计算机网络管理系统及应用问题进行分析,首先阐述了计算机网络管理系统的构成情况,然后详细论述了计算机网络管理系统的应用情况进行分析,其内容有:成本管理功能、故障分类功能、网络配置功能、网络安全管理功能。最后总结了计算机网络管理系统的应用前景。  关键词:计算机网络;管理系统;系统应用  时代的发展与进步,加速了信息化进程,人们对计算机的应用越来越广。在这种情况下,计算机网络得到了较好
摘要:学校的教务平台和学生管理系统正在加速向WEB方向发展,设计一系列的技术手段,在尽量不增加开发难度和硬件费用的前提下,提升高校管理平台的数据库的安全性。  关键字:数据库,SQL注入,安全  1.概述  随着互联网和高校信息化的发展,学校业务上网成了学校的“必修课”,现在大部分院校都可以提供在线学生信息系统服务。在方便了学生的同时,却也给学校的网络安全带来了更大的挑战。  在学校网络安全防护的
鉴于车辆公司的业务发展迅速、订单类型复杂,客户与供应商数目巨大,供应链物流管理繁重,为了更好的解决这些问题,先以整车配件为研究对象。
摘要:科学技术的快速发展使得信息技术等先进的科学技术软件开始融入到学校中、企业中以及我们的当中当中,加强对高校计算机网络专业学生的教学指导尤为重要。但是当前很多高校的计算机网络专业教学的过程当中,仍然存在着一些问题。本篇文章主要从高校计算机网络专业教学中存在的问题以及高校计算机网络专业教学改革的具体策略两个方面进行分析,提出明确定位教学目标,注重学生未来发展;创新专业教学方式,注重教学实践指导;健
摘要:在信息系统当中,所有的运用者的操作都应该严格符合相关的要求,有效保证信息系统的安全性。在本文中,简单分析了对于信息安全系统的反思,描述了可信赖的计算环境,并提出了安全技术的防护框架。  关键词:积极防御;综合防范;防护体系;反思;计算环境  1.对信息安全系统的反思进行一定的分析  现在,大多数的信息安全系统的构成主要包括病毒的防范、入侵的监测以及防火墙等。相对比较常规的安全方法应该在网络层
摘要:随着社会的不断进步和发展,科学技术的不断改革创新,计算机受到了越来越多人的关注和使用。计算机在人们生活中起着至关重要的作用,伴随着时间的推移,人们的日常生活早已离不开计算机。计算机软件开发作为计算机发展道路上的关键环节,理应得到人们的高度重视,软件开发的好坏直接影响到未来计算机市场的发展。本文将进一步的对影响计算机软件开发的因素展开分析和探讨。  关键词:计算机;软件开发;影响因素  0.引
摘要:网络现目前的安全研究新方向已经转变为网络可生存性研究,网络的可生存性研究是一种全新的观念,甚至在很大意义上已经打破了传统的网络安全概念。从一个新的视角研究网络的安全问题,从网络系统可生存性的定义出发,对系统的需要和生存性的研究进行了统一的介绍,并且在安全性、可靠性和生存性的基础上提出了网络可生存性的独特的设计方法,并总结出了新的研究趋势。本篇文章主要是针对网络可生存性进行相关的研究,并得出研
摘要:本文对如何提升LTE网络分流能力、提升LTE驻留率指标进行分析,从覆盖、容量/性能、用户/终端等方面分析原因,结合在网络实际应用的情况,提出相应的解决方案和建议。  关键字:LTE分流;驻留比  1前言  随着移动业务的快速发展,网络负荷不断增加。而LTE-LTE網络由于网络和终端等原因,无法有效的分担网络GSM网络的压力,2个网络间负荷不均衡,影响网络质量。同时,用户使用LTE网络可以提供
摘要:随着我国经济高速发展,我国的网络技术也得到极快的发展,网络技术的发展为人们的生活和工作带来了极大的便利,但是也因为网络的发达使得人们面临的网络威胁日益增大,为了确保网络数据安全性,目前市场出现了各类的防火墙技术、入侵检测技术、网络隔离技术、病毒预防技术等,这些技术对于保证网络安全以及数据安全有重要的作用,但是本文主要探讨计算机密码学的应用对于数据安全性的保障,以为相关人士提供借鉴。  关键词