MOOC讨论区话题挖掘研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:luck_mike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
教育要面向信息化、面向现代化。教育大数据趋势下,信息技术辅助教学的需求日趋强烈。开展MOOC课程教学不仅需要提供质量优异的教学内容,更需要获取数据驱动型教学的过程性、总结性分析结果,使分析结果成为师生互动、生生互动的纽带。促使教学者有效地掌握课程动态,实时地调整教学策略,正确地引导学习者学习过程,这些分析结果对于学习者则是最直接的学习反馈,有助于学习者更加自觉、主动地参与学习。在MOOC课程教学过程中,讨论区文本数据是重要的课程互动、交流协作的体现,是掌握学习动态、评估教学质量的重要数据支撑。MOOC课程平台上时刻产生着大量的文本数据,通过人工阅读和标注的方法很难完成语义信息的统计工作,此外,学习者之间的文本语义存在相似性,不同话题随时间也会发生变化,对文本中隐藏的语义信息实现自动、有效地挖掘和展示是在线学习分析的重要研究问题。本研究以中国大学MOOC平台陕西师范大学《现代教育技术》课程为实验对象,分析讨论区文本的学习者话题内容和话题演化情况。基于文献研究梳理了MOOC学习者话题挖掘的现状和相关技术,选定《现代教育技术》各单元学习体验与反思的讨论文本为实验数据并对实验数据进行预处理,包括文本过滤、基于jieba的中文分词、去停用词和基于TF-IDF算法的文本特征化处理等过程,使文本数据转化为话题模型能够处理的特征向量形式,通过对话题分类、聚类相关技术的比较,厘清了话题模型在处理隐含语义信息方面的优势,选取作者话题模型和动态话题模型作为本研究的核心技术方法,探讨学习者讨论话题内容、话题相似的作者推荐、话题随时间的演化等问题,并对数据结果进行可视化展示,针对已经产生的数据结果的特点,将文本数据可视化形式分为基于文本内容的可视化和基于话题模型的可视化两类,使用到的可视化技术有柱状图、词云图、热图、pyLDAvis和t-SNE。话题挖掘是对MOOC践行关联主义学习理论的有益尝试,为促进在线开放课程的师生交互、感知学习共同体方面提供了一定的帮助。实验结果表明:并不是每个单元内容都能匹配到话题挖掘结果,学习者话题大多讨论的是课程中前期的内容,尤其第八、第九单元并未发现显著话题;基于话题相似作者推荐功能的实现,学习者能够更简单快捷地找到相似学习群体,并且在一定程度上对讨论内容的抄袭行为起到了监督作用;话题“信息时代教学要求”体现了“信息时代学习者”的观念转变,“信息技术能力提高”是信息时代的教学要求;话题内关键词概率的变化表明话题讨论重点的变化,例如话题“学习理论基础”前期的讨论重点是学习理论,后期的讨论重点是信息技术;学习者在选择讨论用语时倾向围绕“核心关键词”进行描述,并会倾向一同使用有关联的词汇组合,例如学习者倾向绑定“认知”主义、“行为主义”、“建构主义”和“人本主义”四个学习理论一同使用,反映出学习者普遍对“学习理论”专题的掌握较为全面,“多元智能”理论作为专题“理论研究新进展”中最常被谈及的理论,其他新理论的关键词似乎并没有受到足够关注;话题内关键词的使用概率与单元的开设时间有明显的相关关系,部分学习者能够跟随课程单元按时学习;对课程正面评价的情感词汇在课程中后期成为高概率词汇,学习者对课程的认可存在一个渐进的过程;各话题热度大多呈现平稳或上升趋势,课程学习中的话题讨论具有稳定性和持续性:可视化结果反映:抽取的话题概率大小接近,课程讨论中并没有出现绝对的热门话题,MOOC讨论区还存在大量话题识别困难的讨论文档,这些学习者的讨论话题十分分散,通过t-SNE图学习者可以清楚地了解到自己与主流话题的契合程度。这些分析结果能够让教学者清楚地把握课程内容的讨论情况,促使教学者对课程内容和结构进行评估和优化;学习者能够快速发现共同学习群体,促进学习者对共同话题的深入讨论。为进一步实现MOOC课程的自适应学习和个性化学习提供参考。
其他文献
关于荷马社会究竟是否为真实的存在这一问题,学术界一直争论不休。有人认为它确实为真实的存在,反映的是公元前9-10世纪的历史面貌,有人认为其反映的是成书的年代,即公元前8
杜鲁门·卡波特是当代文学领域中最著名的美国南方作家之一。他发表的第一部小说,《别的声音,别的房间》于1948年出版,奠定了卡波特在美国文坛上的地位。童年不幸的的生活对
大脑时刻暴露在各种各样的外部刺激和内部病变下。能够抵御这些损伤、维持系统基本功能的能力,称为弹性。临床数据和仿真实验表明,大脑面对不同损伤时表现出不同的弹性:有的
连续倒塌是一种人为原因或者自然灾害引起的灾难性结构事故,结构的局部破坏引发连锁反应最终导致整个结构的破坏。比如,当某根柱子失效之后,作用在该柱上的荷载需要转移到相
网络地图是展示全球实时网络拓扑结构和网络资源的电子地图,网络地图在网络安全攻防、网络故障排查、网络资源探测等多方面具有重要的作用,构建网络地图有利于维护网络的稳定
随着无线通信技术和电子设备的飞速发展,传感器网络在目标跟踪相关领域作为一种重要的监测平台得到了广泛应用。由于传感器探测范围有限,当目标远离网络时,系统难以保持对目
近年来,数据共享发布中的隐私保护问题得到了研究者的持续关注,提出了多种不同类型的隐私保护方法,不同隐私保护方法提供的保护效果各异,对保护强度进行统一度量是隐私保护效果评估的基础。针对已有隐私保护强度度量方法不适用于度量数据世系和流式直方图的隐私保护强度度量的问题,提出基于最小熵的数据世系隐私保护强度度量方法和基于贝叶斯定理的流式直方图隐私保护强度度量方法。论文工作如下:(1)针对已有隐私保护强度度
秦至西汉时期,国家如遇紧急战事,会征发刑徒至边境。统治者往往先下诏书弛刑,传世文献中将其称为“弛刑徒”或“施刑徒”。弛刑徒行动相对普通刑徒自由,但是其刑徒的身份并没
自然图像合成是指从一幅源图像抠取或者提取感兴趣的前景目标,再将其合成到目标图像,并且使合成之后的目标图像具有尽可能好的视觉感知效果。图像抠图与合成是数字图像处理和
随着我国城市规模的不断增大,轨道交通建设任务越来越重,其中,大跨径轨道交通桥梁建设越来越多,并主要采用钢结构桥梁。就桥梁设计规范来看,轨道交通桥梁钢结构疲劳设计方面的规定还不全面。本文依托重庆市建设科技项目“大跨度城市轨道交通桥梁横向刚度及钢箱梁疲劳设计研究”,主要针对轨道交通桥梁钢桥面结构实时应力测试及疲劳应力幅进行研究:(1)通过大型桥梁专用有限元分析软件对研究的依托工程—千厮门嘉陵江大桥建模