网络教学资源的时间动态推荐算法研究及应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bbcat1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术在教育领域的不断深化,教学信息呈爆炸式增长,随之而来的信息过载问题,使得教学工作者和学习者难以获取有效信息资源,严重制约着他们的工作学习效率,推荐系统通过分析用户信息和历史行为,主动为用户筛选其感兴趣的信息资源,是解决信息过载问题的一种有效途径。而对教育领域的资源推荐,由于用户对教学资源的兴趣,受课程知识点、用户知识水平、理解能力等因素影响,呈现出显著动态变化的特点,因此,对网络教学资源推荐务必考虑用户兴趣的时间动态演变;同时在当前教育信息化应用中,教学资源库的建设往往重视资源内容的丰富,而忽略了用户行为数据的收集,从而用户行为数据稀疏现象十分常见,常用推荐算法难以取得良好效果和性能;而在教学网站运行初期,数据稀疏现象尤为严重,时间动态推荐算法,难以从行为数据中学习用户兴趣动态变化模式,并且大量教学资源,由于缺少用户行为记录,存在冷启动问题。  本文针对网络教育资源推荐所面临的用户兴趣动态演变、用户行为数据缺失和数据极度稀疏问题,研究网络教学资源的时间动态推荐算法,并将其应用于北京鸿合科技的企业教育云平台中。本文具体研究内容如下:  (1)针对用户对教学资源的兴趣随知识点迁移而呈现明显时间动态变化的特性,提出一种基于隐半马尔科夫模型的协同过滤推荐算法,该算法使用隐状态表示用户的潜在兴趣,并引入状态逗留时间,来表征用户潜在兴趣的驻留时间,利用半马尔科夫过程所包含的状态转换和状态持续,实现对用户潜在兴趣变化和驻留时间的跟踪,并利用多个时间点隐状态和状态转移,以及持续时间的概率分布,可以更加稳定准确地推理用户下一潜在兴趣和对每个资源的选择概率,实验分析表明,该算法能有效对用户潜在兴趣驻留时间的异质性(不同变化模式)进行建模和表征,从而在具有时间动态变化特征的应用场景中,能够显著提高推荐算法效果。  (2)针对用户行为数据不完备(数据稀疏)的状况,提出一种基于抑制隐马尔科夫模型的协同过滤推荐算法,该算法引入带不同情形(抑制或活跃)的隐状态,来表示用户的潜在兴趣,利用隐状态的抑制情形,来表征用户潜在兴趣的空置状态,实现对由于数据稀疏引起的用户行为在时间点上缺失的建模,利用隐状态的活跃情形,来表征用户潜在兴趣的激活状态,实现对用户操作资源行为的建模,并结合马尔科夫过程的状态转换,跟踪用户兴趣的动态变化过程,同时,根据用户当前兴趣和状态转移概率分布,推理下一时刻用户在兴趣激活状态条件下,选择资源的概率分布。实验表明,该方法可以有效控制数据稀疏所引起的用户行为时间不连续现象,从而能够提高在不同稀疏度状况下的算法效果。  (3)进一步,针对实际网络教学环境中,系统初上线所面临的用户行为数据极度稀疏及新上线资源缺乏用户数据(资源冷启动)问题,提出一种基于课程序列结构的混合推荐算法。该算法以用户正关注的课程作为用户兴趣点表征,利用决策树和马尔科夫链模型,对课程教材分类层级结构和课程编排先验知识进行建模;通过资源的文本内容分析计算课程与资源、用户之间的关系,实现对用户兴趣的跟踪,从而解决资源冷启动问题;并以加权的方式引入基于用户行为的资源关联度计算结果,对有限行为数据进行充分利用。该方法将融合了课程序列先验知识、用户行为和资源内容的信息进行推荐,实验表明,可以实现在数据极度稀疏状况下,对用户兴趣的动态跟踪,提高推荐算法效果。  最后,论文将研究成果应用到北京鸿合科技的实际工程项目中,开发了一个由数据模型分析、离线算法分析和在线资源推荐三层结构组成的混合推荐系统,实现了其教育资源库中12个年级,9个教材版本和10个学科教育资源的个性化推荐,并完成了混合推荐系统与该企业软件产品的集成。
其他文献
学生的学籍信息是各个学校的一项重要的数据资源。长期以来,学籍管理都是依赖人工方式进行的,面对日益众多的学籍信息,其工作量可想而知。因此设计一个跨平台的、网络化的学籍管
生产实时监控系统与信息管理系统的集成有着很重要的实际意义.通过共享这两种系统之间的资源可以更好地为生产决策服务.该文通过结合试飞安全监控及检索系统的具体实现,对网
体绘制是科学可视化的重要组成部分,它是一种直接由三维数据场产生屏幕上二维图像的技术。随着计算机技术的快速发展,相关成像设备的图像采集能力变得越来越强,采集得到的数据集
该文利用中间件构建三层的分布式数据库应用系统进行了研究与设计.重点进行了中间件技术的研究工作,包括中间件的起源、分类、功能、应用领域以及中间件技术带来的益处和其发
将传统的Client/Server结构的数据库系统与当前作为Internet重要基础的WEB技术相结合,是当前计算机研究领域的一大热点.该课题就是利用动态WEB技术开发一个网上高校 教务管理
该文先介绍了代理服务器的特点、作用及流行的代理服务器软件,并根据代理服务器工作的层次将其划分为应用层代理、传输层代理和SOCKS代理.然后在分析了代理服务器的 工作流程
该文以江苏高速公速公路网联网收费工程为对象,探讨高速公路网联网收费技术.首先分析路网收费技术的现状,并根据联网收费需求,提出了路网收费的原则和实现方案.在对几种高速
随着移动互联网的普及和社交网络工具的出现,如今人类正以史无前例的速度生产出新的信息。面对浩如烟海的信息,人们正在面临着“信息过载”带来的一系列问题。用户兴趣建模和个
随着信息技术的飞速发展,信息系统特别是软件系统在人类生活中起到越来越重要的作用。对于信息系统,特别是软件系统的可信程度做出度量的需求也应运而生。软件行为声明,是采用言
该课题的目的正是研究如何有效地将数据仓库技术应用于公安决策系统中.数据仓库技术是由方法、技术和工具所共同构成的在集成平台上为最终用户提供数据的手段,是多种技术的综