论文部分内容阅读
经典的协同过滤算法在推荐系统中取得了出色的成果。然而,由于协同过滤算法仅专注于探索用户与物品的交互历史,因此在用户与物品的交互很稀疏时很难发挥出色的作用,即协同过滤算法无法有效地处理冷启动问题。为了缓解该问题,越来越多的推荐算法开始使用外部知识,如用户自身的属性,来为算法提供信息支持。知识图谱作为一种高质量的结构化数据,正在被越来越多的推荐系统所使用。现有的利用知识图谱的推荐算法大致可分为三类:基于嵌入的推荐算法、基于路径(规则)的推荐算法和基于聚合的推荐算法。这三类算法都在实践中取得了一定的成果,同时也存在着一些缺陷。基于嵌入的推荐算法通常利用成熟的知识图谱嵌入模型来获得知识图谱的嵌入,它们往往只考虑用户与实体之间的直接联系,忽视了用户与实体之间的长程语义依赖。基于路径(规则)的推荐算法能够使用路径来捕捉长程语义,然而规则所引导的线性建模方式无法充分考虑不同实体之间的多样化联系。基于聚合的方法通过设计独特的聚合机制或利用图神经网络,充分考虑了实体间的多样化联系,却依然在捕捉明确的长程语义依赖上存在问题。针对现有方法存在的不足,本文提出了一种结合规则和图神经网络的推荐算法RGRec(Rule-Guided Graph Neural Networks for Recommender System),它能够在捕捉用户与实体间的长程依赖的同时充分的考虑不同实体之间的多样化联系。在规则部分,为了获得高质量规则,本文设计了自动的规则挖掘和快速规则筛选方法,并以规则来捕捉用户与实体之间的长程语义依赖。关于图神经网络,针对随机选点所带来的信息损失及噪音引入问题,本文使用规则进行选点的引导,并建立起中心节点与远距离节点之间的明确语义联系,获得多条规则引导下的多维度特征,并通过对多维度特征的加权整合,将中心节点周围的信息进行合理的汇聚,以此充分考虑不同实体之间的联系,防止实体被孤立处理。本文设计了对比试验,在点击率预测和top-K推荐这两个场景下,使用三个真实世界数据集Last.FM、Movie Lens-1M和Dianping-Food,将RGRec与多个有代表性的算法进行对比,证明了RGRec的优越性,同时也证明了本文对规则和图神经网络的结合是有效的。