论文部分内容阅读
随着信息技术在教育领域的不断深化,教学信息呈爆炸式增长,随之而来的信息过载问题,使得教学工作者和学习者难以获取有效信息资源,严重制约着他们的工作学习效率,推荐系统通过分析用户信息和历史行为,主动为用户筛选其感兴趣的信息资源,是解决信息过载问题的一种有效途径。而对教育领域的资源推荐,由于用户对教学资源的兴趣,受课程知识点、用户知识水平、理解能力等因素影响,呈现出显著动态变化的特点,因此,对网络教学资源推荐务必考虑用户兴趣的时间动态演变;同时在当前教育信息化应用中,教学资源库的建设往往重视资源内容的丰富,而忽略了用户行为数据的收集,从而用户行为数据稀疏现象十分常见,常用推荐算法难以取得良好效果和性能;而在教学网站运行初期,数据稀疏现象尤为严重,时间动态推荐算法,难以从行为数据中学习用户兴趣动态变化模式,并且大量教学资源,由于缺少用户行为记录,存在冷启动问题。 本文针对网络教育资源推荐所面临的用户兴趣动态演变、用户行为数据缺失和数据极度稀疏问题,研究网络教学资源的时间动态推荐算法,并将其应用于北京鸿合科技的企业教育云平台中。本文具体研究内容如下: (1)针对用户对教学资源的兴趣随知识点迁移而呈现明显时间动态变化的特性,提出一种基于隐半马尔科夫模型的协同过滤推荐算法,该算法使用隐状态表示用户的潜在兴趣,并引入状态逗留时间,来表征用户潜在兴趣的驻留时间,利用半马尔科夫过程所包含的状态转换和状态持续,实现对用户潜在兴趣变化和驻留时间的跟踪,并利用多个时间点隐状态和状态转移,以及持续时间的概率分布,可以更加稳定准确地推理用户下一潜在兴趣和对每个资源的选择概率,实验分析表明,该算法能有效对用户潜在兴趣驻留时间的异质性(不同变化模式)进行建模和表征,从而在具有时间动态变化特征的应用场景中,能够显著提高推荐算法效果。 (2)针对用户行为数据不完备(数据稀疏)的状况,提出一种基于抑制隐马尔科夫模型的协同过滤推荐算法,该算法引入带不同情形(抑制或活跃)的隐状态,来表示用户的潜在兴趣,利用隐状态的抑制情形,来表征用户潜在兴趣的空置状态,实现对由于数据稀疏引起的用户行为在时间点上缺失的建模,利用隐状态的活跃情形,来表征用户潜在兴趣的激活状态,实现对用户操作资源行为的建模,并结合马尔科夫过程的状态转换,跟踪用户兴趣的动态变化过程,同时,根据用户当前兴趣和状态转移概率分布,推理下一时刻用户在兴趣激活状态条件下,选择资源的概率分布。实验表明,该方法可以有效控制数据稀疏所引起的用户行为时间不连续现象,从而能够提高在不同稀疏度状况下的算法效果。 (3)进一步,针对实际网络教学环境中,系统初上线所面临的用户行为数据极度稀疏及新上线资源缺乏用户数据(资源冷启动)问题,提出一种基于课程序列结构的混合推荐算法。该算法以用户正关注的课程作为用户兴趣点表征,利用决策树和马尔科夫链模型,对课程教材分类层级结构和课程编排先验知识进行建模;通过资源的文本内容分析计算课程与资源、用户之间的关系,实现对用户兴趣的跟踪,从而解决资源冷启动问题;并以加权的方式引入基于用户行为的资源关联度计算结果,对有限行为数据进行充分利用。该方法将融合了课程序列先验知识、用户行为和资源内容的信息进行推荐,实验表明,可以实现在数据极度稀疏状况下,对用户兴趣的动态跟踪,提高推荐算法效果。 最后,论文将研究成果应用到北京鸿合科技的实际工程项目中,开发了一个由数据模型分析、离线算法分析和在线资源推荐三层结构组成的混合推荐系统,实现了其教育资源库中12个年级,9个教材版本和10个学科教育资源的个性化推荐,并完成了混合推荐系统与该企业软件产品的集成。