【摘 要】
:
近几年,以MOOC平台为典型代表的在线教育平台正迅猛发展。在线教育没有中高考等门槛,没有必须在某个地方才能学习的要求和弊端。这让每个人都可以平等地享受到名牌大学的优质教育,学习者可以根据自己的兴趣和需求,自由地选择有兴趣的,流行的或者是大家都称赞的课程。但是,这在为学习者学习提供极高的便捷性的同时,也割裂了传统课堂学习环境下,学习者和其他人的直接接触。由此导致了学习者总是习惯于独自学习,没有动力去
【基金项目】
:
教育大数据分析挖掘技术及智慧教育示范应用国家重点研发计划项目的个性化教育资源融合与推荐关键技术子课题;
论文部分内容阅读
近几年,以MOOC平台为典型代表的在线教育平台正迅猛发展。在线教育没有中高考等门槛,没有必须在某个地方才能学习的要求和弊端。这让每个人都可以平等地享受到名牌大学的优质教育,学习者可以根据自己的兴趣和需求,自由地选择有兴趣的,流行的或者是大家都称赞的课程。但是,这在为学习者学习提供极高的便捷性的同时,也割裂了传统课堂学习环境下,学习者和其他人的直接接触。由此导致了学习者总是习惯于独自学习,没有动力去主动联系或者不习惯于联系互联网上的非直接接触的学习伙伴。缺少学习伙伴交流和共同学习氛围导致学习效率不高、学习持久性不强、课程辍学率高等问题。本文考察了传统教育学中关于学习伙伴构建关键要素,结合在线教育平台的用户行为特点,参考传统电商推荐系统的流程,构建了一整套在线教育的学习者协同学习社交关系构建方法。并初步进行了学习者在线教育交互平台的工程设计探索。本文就如何解决在线教育平台学习者伙伴推荐的课题展开四个子问题的研究,即基于教育心理学背景的在线教育平台学习者特征抽取,学习者基本伙伴网络构建及学习社区发现,基于神经网络排序的在线教育平台学习者学习伙伴匹配以及基于无标度网络理论的伙伴网络模拟收敛与伙伴推荐列表混排。对于学习者特征抽取子问题,本文首先探究了传统教育学当中,学习者之间构建起良好的学习伙伴关系过程当中的相似性、接近性、补偿性、外观性等重要因素。接下来,分析了在线教育平台与传统教育平台相比,学习者行为特征的差异性和各自的特点。根据这些特点,有针对性,选择性的强化了传统教育环境下的某些影响特征,另外提出了一些特有的特征,弱化了甚至删除了另外一些在线教育平台体现不明显的特征。给出了在线教育平台学习伙伴推荐关键因素的具体量化方法。对于学习者基本伙伴网络构建及社区发现子问题,本文根据传统社交网络研究当中的用户交互图理论,结合在线教育平台学习者直接交互稀少的特点,基于上面提出的在线教育平台关键要素研究给出了平台特有的学习者基本交互网络构建算法。之后,根据在线教育平台用户行为特征,针对性改进并实验测试了三种不同的网络划分社区算法,分别是kMean+Jaccard算法,Girvan-Newman介边切割算法以及随机游走算法。并最终选择介边切割算法来进行工程实践和进一步实验。对于神经网络排序子问题,本文首先根据传统教育学领域的伙伴标注方法,结合在线教育平台特征给出了在线教育平台伙伴关系随机标注算法。使用该方法结合时间序列分段来进行神经网络训练集和测试集的生成。接下来,根据之前所抽取的不同学习者特征,对不同的特征采用有针对性的网络结构进行了向量化处理并合在一起生成最终的神经网络输入。并设计了最终的伙伴分类网络总体结构,在之前划分好的学习者社区当中完成了学习者伙伴关系匹配的实验。同时还进行了不同学习者特征的对于伙伴关系构建影响力大小的定性分析。对于网络收敛和伙伴推荐列表混排子问题,本文首先分析了在线教育平台上学习者与其推荐伙伴之间形成的网络结构随时间推进呈现出的无标度网络结构特性,之后通过分析无标度网络生成理论,给出了本文下学习者及其伙伴网络模拟演化收敛算法。接下来从社交三角理论出发,给出了在伙伴网络收敛后,解决学习者交流“茧房效应”的推荐伙伴混排算法。并根据实验证明了当前混排推荐伙伴列表比原有推荐伙伴列表有着更好的精确度。
其他文献
光学字符识别(Optical Character Recognition,OCR)作为促进办公自动化的一项重要技术应用场景十分广泛,随着近年来支持OCR有监督学习的训练数据爆炸性增长,针对文本检测和识别的OCR技术研究逐渐成为深度学习领域一个前景十分广阔的热门研究方向。本文研究基于深度学习的OCR技术,研究重点是如何在保证OCR过程中文本检测和识别准确性的同时,尽可能地提升模型的推理速度,高效快速
时间依赖图在传统静态图上引入了时间维度,是一种图数据随时间变化的模型。时间依赖图模型能够以更加贴合实际的表达方式来刻画现实中存在的问题,因此有越来越多的研究工作在相关方面展开。本文从时间依赖图模型入手,着手于时间依赖图系统框架的设计与时间依赖图上算法的研究。基于Neo4j图数据库,本文设计并实现了一个能够持久化存储时间依赖图的系统框架TD-Frame。该框架使用Neo4j图数据库作为时间依赖图的存
航空发动机被誉为“工业皇冠上的明珠”,更被认为是飞机的心脏。叶片则是航空发动机核心部件,各级叶片为发动机提供80%以上的推力。叶片在复杂的力学环境下工作会导致叶形发生改变,而叶片叶形的变化会使通过发动机内部的气流相对于设计工况发生改变,从而影响到发动机的稳定性、噪音水平和推力性能等。掌握叶片在工作条件下的变形规律,不管是对于现有航空发动机的安全运行还是对于新型叶片的优化设计都有很大的意义。本课题针
跨媒体内容质量评估的目的是用计算机的方法去衡量人对于跨媒体内容的主观感知。目前的方法对于跨媒体质量的分析分为主观评估和客观评估。客观评估多是以分辨率和帧率评定视频质量,以强度和音调衡量声音,以行文规范判断文本质量。然而新的需求是从跨媒体的深层内容出发,思考其蕴含的价值观和内涵,并能参考大众的反响程度。建立一个跨媒体内容质量评估系统,有助于增强对跨媒体内容深层理解和分析的探索。本文提出了一个跨媒体内
传统的医学图像分割主要靠人工完成,这种方法不仅耗时且不可复现。自动化分割技术虽然可以提高处理效率但是大大降低了处理结果的准确性,特别是在组织边缘和细小分支结构区域。基于深度学习的交互式分割方法可以平衡二者的优缺点,兼顾分割的准确性和高效性,在心脏CTA(Computer Tomography angiography)数据组织分割问题中具有十分重要的意义。虚拟内窥技术可以解决传统医学内窥镜无法无创入
数据科学时代,常常需要利用数据集训练学习算法来完成相关任务。其中,训练使用的数据集往往需要我们前瞻性的进行收集,如果想要模型对不太常见的数据也具有良好的效果,数据集必须包含足够的与这些数据相似的例子。训练数据集对待预测数据的覆盖不足往往会导致预测的不准确,为了提前预见到这些不准确性,本文提出了一种评估多维类别型属性数据集对待预测数据的覆盖程度的方法。本文面向评估数据集对待预测数据覆盖程度这一课题,
事件抽取是指从自然语言文本中抽取其中包含的结构化事件信息的任务。事件抽取任务按照抽取目标是否限定为特定领域的事件,可以分为限定域事件抽取和开放域事件抽取。限定域事件抽取需要先指定抽取的领域,人工预定义该领域的事件模式,并基于此进行该领域事件抽取。开放域事件抽取是指在不限定事件类型及模式的情况下,从文本中检测不限定类型及模式的事件并对事件论元信息进行抽取。限定域事件抽取任务的方法往往存在领域间迁移困
随着软件项目需求的急速增长,在软件设计与实现的过程中难免会存在一些缺陷。当软件项目的使用者以及测试人员,发现程序运行过程中出现与预期结果不一样的情形时,会及时向缺陷追踪管理系统报告自己发现的缺陷。但对于大型开源软件项目而言,缺陷追踪管理系统每天都会收到大量的缺陷报告。如果依靠开发人员手动检查并寻找相关源代码所在位置,是一件极其耗费时间与精力的事,因此将缺陷报告中的缺陷自动定位到相关源代码就显得至关
随着当今技术的快速发展以及数据产生方式的多样化,人类所拥有的数据规模日趋庞大,海量数据带来了客观的数字价值,同时也在数据质量方面带来了更多的挑战。时间序列数据是伴随物联网的飞速发展产生的数据,工业界中的时间序列数据往往存在数据异常、数据乱序、属性值缺失、属性值错位等问题,其中属性值错位问题相关的研究比较少,但该问题在工业场景中十分常见,因此研究该问题具有重要的意义。本文从面向实际的数据流场景出发,
理解在软件仓库中执行的维护活动可以帮助软件从业者减少维护成本,做出关于资源分配的决策,从而提高效益。对于大多数软件系统来说,bug是通过软件仓库的问题追踪系统来跟踪的,代码变更是以提交给源代码控制库的形式来合并的。因此,检查软件开发的这些基本工件(新的错误报告或提交)来实时检测bug是很方便的。本文的目标是自动对软件开发过程中的一系列提交进行高精度分类,将提交分类为bug修复相关或与bug修复无关