论文部分内容阅读
随着互联网的普及与发展,数据量呈指数型爆炸式增长,如何管理和应用如此海量的数据成为一大难题。知识图谱的出现为互联网数据提供了一种新的管理方式,人们从匹配式检索过渡到智能化问答式检索,挖掘了海量数据的潜在价值,为智能化揭开了序幕。随着知识图谱概念的深入与发展,各家公司都开发了自己的知识图谱,而当前的知识图谱存在的最大问题便是知识的缺失,知识推理正是解决该问题的关键技术,以往的知识推理方法都有一定的局限性:模型复杂、可解释性差、效率低。经典的翻译模型所使用的信息仅包括实体三元组,缺失知识图谱中的路径、实体类别等信息,已不在适用于结构逐渐复杂的知识图谱。本文的重点在于将知识图谱中的多种信息融合运用到知识推理中。知识推理的重点是对知识图谱的补全,知识图谱的组成基础是实体三元组,因此本文从链接预测和实体分类两个任务分别进行研究。对于链接预测任务,在三元组的基础上引入路径信息和实体描述信息,分别增强模型对路径关系的提取能力以及模型对于实体类型的区分能力。对于随机游走产生的庞大路径集合,对该路径进行聚合,大大减少路径的数量,减少了算法的开销,一定程度上提高了路径预测的准确率。对于实体分类任务,与命名实体识别任务类似,均为对实体进行分类、打标,但是知识图谱中的数据结构与文档型数据差异较大,无法直接套用模型与方法。本文使用图卷积神经网络进行提取信息,并在此基础上对待预测实体周围不同邻居实体影响力加以区分,最终图卷积神经网络的输出作为待预测实体的向量表示,充分提高了模型实体分类的能力。为验证本文所述方法与模型的有效性,选取翻译模型、DKRL等模型作为对比构建实验,使用与该实验相同的数据集,分别设计链接预测和实体分类的对比实验。实验结果表明,对比以往方法,本文提出的方法效果更好,可以有效帮助进行知识图谱的知识推理。