论文部分内容阅读
随着互联网和web2.0技术的飞速发展,网络上信息资源快速增长,导致“信息过载”的问题愈发严重。用户从海量的文本、视频、图像和音乐等网络资源中找到符合自己需求的内容变得愈发困难。推荐系统是解决上述问题的关键技术之一,推荐系统通过统计分析研究用户历史行为数据,得到用户的兴趣偏好,从而进行个性化推荐。推荐系统当前的应用领域主要集中在电子商务、电视电影、音乐网站、新闻资讯和广告推送等方面。在其他领域,也亟需推荐系统解决一些问题,在教育领域,根据《中国互联网络发展状况统计报告》和iiMedia Research调查数据显示,随着我国“互联网+教育”发展理念的发展和普及,我国在线教育平台和用户规模逐步上升,在2020年将达到了3.09亿人,我国在线教育市场规模在2020年将达到了7230.6亿元。学习者如何从海量的学习资源中快速找到符合自己需求的内容成为了一个不得不面对和解决的问题,目前对学习资源推荐方法的研究处于初级阶段,本论文针对学习资源推荐存在的问题提出新的方法。主要工作如下:1.针对传统的协同过滤方法新学习者“冷启动”和数据稀疏性问题,提出了一种基于用户兴趣度迁移的跨领域学习资源推荐方法。鉴于学习者在不同领域积累了大量评分数据,且在不同领域的学习者偏好存在相似性,该方法利用学习者评分信息,提出一种新的RF-ILF方法构建用户兴趣度;针对目标领域“冷启动”学习者,利用变换矩阵方法,借助学习者在辅助领域的兴趣度得到其在目标领域的兴趣度;最后将辅助领域中的学习者兴趣度迁移到目标领域以缓解目标领域数据稀疏性。真实数据集上的实验结果表明,该方法与已有的单领域协同过滤方法和基于评分模式的跨领域方法相比,具有更高的准确率、召回率和F1值。2.针对基于评分数据的传统推荐方法中评分数据的稀疏性严重影响推荐性能问题,鉴于学习者对学习资源的评论文本不仅直观地描述了学习资源获得评分及评分高低的原因,而且不同学习者对同一个学习资源具有不同的评估点和叙述方式,为了缓解数据稀疏性以提高推荐正确率,提出一种基于BERT模型和评论文本的学习资源推荐方法。利用BERT模型分别对学习者和学习资源的评论文本进行处理,并结合注意力机制得到学习者偏好向量和学习资源特征向量;根据评分矩阵得到学习者和学习资源的潜在隐向量,并将上述学习者和学习资源的两种向量利用融合门进行融合;最后,将传统向量相乘的评分预测方式改进为深度神经因子分解机的方式。在4组数据集上的实验结果表明,该方法在RMSE上优于传统的基于评分和评论文本的方法,最高降幅达到4.2%。