论文部分内容阅读
知识图谱结构与推荐数据中用户项目的交互矩阵具有较强的关联性,将知识图谱融合到推荐系统中可以为推荐数据引入更强的语义关系,与此同时通过知识图谱的拓扑结构可获得用户或项目的隐藏特征,以提升推荐结果的准确性、多样性与可解释性。知识图谱融合至推荐系统有三种策略,分别是基于向量化的融合方法、基于路径的融合方法以及联合融合方法。传统的基于向量化的融合方法将用户或项目进行降维,将低维的向量化结果融入至推荐系统框架之中,但该方法忽略了知识图谱的联通性以及知识图谱信息的自身特性。传统的基于路径的融合方法将用户项目交互数据转换为二部图,通过计算图中路径的相似度获得推荐结果,该方法为推荐结果提供了可解释性,但也由于元路径设置困难导致模型通常不具备普适性。联合融合方法是以上两种方法的结合,也是近年来的研究热点。目前的联合融合方法也存在不足,体现在知识图谱向量化表示过程中存在的多重关系学习困难、知识图谱元路径设计缺少普适性、知识图谱数据自身含义缺失、知识图谱向量化结果与推荐系统融合方式过程中低维映射导致的知识图谱信息丢失等多种方面。本文将针对知识图谱与推荐系统的联合融合方法进行分析,从优化知识图谱复杂关系处理过程、知识图谱节点自身含义提取方法以及知识图谱与推荐模型的多元融合方式等角度进行模型的优化与设计,旨在解决当前联合融合方法中存在的不足,对推荐数据构建的知识图谱的拓扑结构信息以及语义信息进行全面地挖掘,并融入至深度推荐模型之中,以提升推荐模型的基础性能。本文研究的内容如下:1.基于游走策略的知识图谱图卷积网络深度推荐模型知识图谱的特征向量与推荐系统融合过程中,常会忽略知识图谱自身的结构信息;基于路径的融合方法过程中,虽然可以通过游走路径的设定提升模型的可解释性,但是也会存在路径设置困难,普适性较差等问题。本文提出的基于游走策略的知识图谱图卷积网络深度推荐模型,KGCNpro模型,属于联合融合方法。首先为了提高知识图谱路径游走的普适性,将推荐数据构成的知识图谱进行重构,由异构网络结构重构为同构网络结构,并按照“实体-关系-实体”的原则进行游走策略的设定,以便更适配知识图谱三元组的模式。通过对知识图谱进行重构,解决了不同实体关系属性训练的权重分配问题,通过对知识图谱的网络结构设计有针对性的游走策略,解决了知识图谱复杂关系的训练问题,通过提出两种训练模型和优化策略,提升知识图谱特征提取的准确性。将游走序列直接作为图卷积神经网络的邻接矩阵,可以最大程度地保留知识图谱的拓扑结构信息,且游走策略可以同时考虑图结构的广度与深度。KGCNPro模型将基于游走地图嵌入表示和传播思想结合,丰富了知识图谱与深度推荐的融合方式,提升知识图谱特征提取的准确性与推荐结果的精准度。2.基于知识图谱作为辅助信息的多模态多任务深度推荐模型在融合了知识图谱的深度推荐模型中通常使用项目数据构建知识图谱。虽然知识图谱作为辅助信息能够提升推荐准确率,但有些信息并不适合以知识图谱的形式进行表示。为此本文提出了基于知识图谱作为辅助信息的多模态多任务深度推荐模型,SIMKR模型。该模型对项目属性采用多模态特征学习的方式进行属性的分类讨论,将项目属性分为文本类型属性、多值属性以及其他类型属性。文本属性采用Text-CNN模型进行深度语义挖掘;多值类型属性采用按序索引的方式,将多值属性进行one-hot编码并进行向量相加,与文本类型属性训练的向量结果共同作为多层感知机层的输入,多层感知机层输出的结果与其他类型属性构成的知识图谱结构进行交叉训练,通过多任务的形式将多模态表示学习结果与知识图谱的拓扑结构相互融合,提升深度推荐的准确性。SI-MKR模型使用依次训练与交替训练的融合方式,将多模态思想与多任务思想相互结合,侧面提升了知识图谱向量化过程中对于一对多、多对多关系的学习能力,保留知识图谱拓扑结构的同时提升了数据自身特征的挖掘能力。3.基于知识图谱的波纹传播与多任务学习结合的深度推荐模型在知识图谱与推荐系统结合的联合融合方法中,可以使用用户与项目的历史交互数据或项目数据的邻域数据作为推荐过程中的辅助信息。目前联合融合方法的融合模式较为单一,导致知识图谱中的潜在信息挖掘不彻底。如何将知识图谱与推荐系统做到最大程度的融合,是值得考虑与研究的。针对这一问题,本文提出了基于知识图谱的波纹传播与多任务学习结合的深度推荐模型,Ripp-MKR模型。这是一种结合联合学习和交替学习两种方式的深度推荐模型。在该模型中,知识图谱首先与推荐数据进行交叉训练,以多任务的方式将知识图谱的特征表示整合到推荐中,其次利用用户与项目的历史交互信息,通过波纹传播的思想获取用户的上下文环境进而获得用户的特征表示。在Ripp-MKR模型中将知识图谱的作用发挥至最大,知识图谱的头部与项目数据进行交替训练,知识图谱的尾部则参与用户的特征向量的构成,将联合训练与交替训练相互结合,提升推荐系统的性能。本文提出的3个基于知识图谱的深度推荐模型,均属于联合融合方法。解决了在知识图谱向量过程中知识图谱复杂关系处理困难的问题,知识图谱节点自身语义缺失的问题、知识图谱向量化过程中带来的信息丢失等问题。解决了在知识图谱与推荐系统结合过程中存在的表示学习结果与知识图谱的拓扑信息结合不深入的问题、信息传播不全面、结合训练方式单一等问题。在真实推荐数据集上进行了大量的实验,实验结果表明,本文提出的三个模型在知识图谱特征表示以及推荐准确定等评估指标上均有较好的性能。这些模型可以解决目前知识图谱融合至深度推荐过程中存在的部分问题,为深度推荐模型的发展起到了良好的作用,有一定的理论意义。