论文部分内容阅读
在信息互联网高度发达的今天,解决信息过载问题已经成为互联网技术发展的方向之一。如何从网络海量信息中获取有价值的信息是研究信息过载问题的关键,而个性化推荐作为解决此问题的关键技术,具有重要的学术意义和应用价值。协同过滤以及协同过滤的各种衍生算法以其不依赖于信息的具体内容、易于实施、可以产生新异推荐等特性被大量的互联网企业所采用,并成为一个学术研究热点。但该类算法都有数据稀疏性,冷启动等问题。针对数据稀疏性问题,现有的方法主要是通过提高评分矩阵的密度或者修正推荐的关键过程来缓解数据稀疏性问题对推荐算法的不利影响,但这两种方法都没有从本质上解决数据稀疏性问题。而对于冷启动问题,有效地利用项目的内容信息和用户的个人信息(社交网络信息)是解决冷启动问题的有效方法之一。本文从增加信息类别的角度出发,把社交网络中用户的好友关系、标签信息加入推荐模型,用于缓解数据稀疏性和冷启动问题对推荐算法的不利影响。在结合社交网络缓解数据稀疏性和冷启动问题的过程中,本文展开了如下工作: 1.提出一种融合信任关系与用户项目二部图结构的矩阵分解推荐方法(CF-SOCBN)。方法在对评分矩阵进行分解的基础上,加入用户信任关系和用户项目二部图结构信息,并在用户项目二部图中采用了物质扩散算法计算用户之间的相似度,采用梯度下降算法训练模型参数。最后在Epinions数据集上与近三年来较流行的算法(PMF算法、CF-BN算法、CF-Soc算法)作对比试验,实验对比表明CF-SOCBN方法在RMSE和MAE上有比较大的提高,尤其在冷启动和稀疏数据情况下,该方法的推荐精度明显优于传统的推荐方法。 2.在CF-SOCBN算法的基础上融入了用户标签信息,提出一种融合信任关系与用户项目标签三部图结构的矩阵分解推荐方法(SocTagTri)。方法在对评分矩阵进行分解的基础上,加入用户信任关系和用户项目标签三部图结构信息,并将用户项目标签三部图分解为用户项目二部图和用户标签二部图,分别对其采用了物质扩散算法计算用户之间的相似度,然后借助线性模型将基于两个二部图的相似度融合成一个相似度。采用梯度下降算法训练模型参数。最后在 Last.fm数据集上与近三年来较流行的算法(PMF算法、SoRec算法、SoRecUser算法)作对比试验,实验对比表明SocTagTri方法在RMSE和MAE上有比较大的提高,尤其在冷启动和稀疏数据情况下,该方法的推荐精度明显优于传统的推荐方法。