迭代学习表示和规则的知识图谱推理方法

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:guansuwei9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来互联网数据的海量增长以及人工智能的发展,知识图谱以强大的语义处理能力和数据互联能力为数据提供了一种新的表达、组织管理和挖掘方式。但是,构建数据嘈杂和信息抽取过程不确定,导致现有知识图谱通常存在缺失现象,因此推理知识图谱以补全具有重要研究意义。知识表示学习,作为知识图谱推理的常用手段,基于潜在特征,在计算效率上具有明显优势,但学习过程仅利用三元组信息,嵌入结果对样本数量和质量有一定依赖,稀疏实体和关系的嵌入质量相对较差。而推理的另一个手段,知识图谱规则学习,则利用图特征进行推理,预测结果准确、可解释,基于图的全局信息得到一般性的语义规律,缺点是挖掘规则的搜索空间较大。本文联合逻辑规则学习表示,提出一个迭代学习表示和规则的知识推理框架Rep&Rul-IL-KGRF,主要内容如下:(1)分析表示学习和规则学习优势互补的可能。一阶逻辑规则含有图结构信息,涵盖的全局一般性规律能够运用到局部的稀疏数据中,且基于规则的推理可解释性强,这些特点有解决表示学习上述问题的可能。知识的分布式向量表示具有计算高效的优势,这可能帮助减小规则的搜索空间。(2)为了增强知识表示的预测精度和可解释性,提出联合逻辑规则的表示学习模型RPEL,旨在利用带有全局归纳语义信息的逻辑规则,来提高稀疏实体和关系的嵌入质量。模型基于封闭路径式的一阶逻辑软规则,通过实例化规则来丰富稀疏数据的三元组样本,基于模糊逻辑t-norm来计算这些新三元组的软标签,除了直接邻居外,通过基于加法和乘法的逻辑规则关系运算来建模稀疏关系的多跳结构信息。(3)为深入研究表示学习和逻辑规则推理之间的交互,提出利用知识表示的规则学习方法EGRL,旨在利用嵌入高效计算的特点帮助挖掘规则。规定与RPEL模型相同的规则形式,将问题转为关系变量实例化问题。生成候选规则时,基于规则的头覆盖率和相似关系获得关系实例,兼容连通性和潜在特征,基于随机采样和遍历实例化关系变量,在搜索空间和高度可能规则覆盖率之间达到相对平衡。计算候选规则置信度时,在传统标准置信度的基础上,融合嵌入中的隐含语义,使评估规则存在率的置信度更有效。综上(2)和(3),得到迭代学习表示和规则的框架Rep&Rul-IL-KGRF,迭代中优势互补、不断更新嵌入和规则,适用于目前多数表示假设。链路预测和生成解释实验表明,随着逻辑规则的加入提高了知识表示的预测精度和可解释性,且提高预测的准确性在越稀疏的数据上帮助越大。规则评估实验证明嵌入对提升挖掘的效率和质量有一定影响。
其他文献
随着地理信息定位技术的发展,用户的生活中开始广泛应用基于位置的服务(Location-based Services LBS),LBS系统的主要目标是获取用户的位置,并向使用者提供即时的信息以便用户做出决策。LBS在诸如车辆导航,医疗保障,用户购物方面都有着重要的应用价值。然而,传统的LBS只是专注于路网距离一个维度,例如,传统的LBS只能查找距离用户最近的酒店而无法查找到距离用户距离近且价格低的酒
学位
因比特币表现出的稳定性和可靠性,具有去中心化、防篡改等技术特性的区块链技术被揭示,并立即得到高度重视。区块链本质上是一个分布式账本,类似分布式数据库,但又有根本区别:去中心化的运行模式。随着区块链应用从数字货币、溯源等迅速扩展到各个领域,已有技术支撑的早期区块链技术方案的容量局限性问题越来越明显,区块链核心技术亟待创新与突破,特别是以公链吞吐量大幅提升和时延降低为代表。现有的扩容技术中,分片技术被
学位
在工业界产品用户体验设计实践中,用户人群划分是一个重要环节。传统的用户人群划分方法存在数据客观性不足、数据分析耗时费力以及过度依赖用户体验工程师主观判断等问题,影响了人群划分的质量。上述传统用户人群划分方法中存在的问题如何借助目前快速发展的用户数据采集工具来加以解决,是一个值得探索的课题。本文针对上述存在问题,选择了游戏、购物两个具有代表性的应用领域,针对每个领域采用迭代方式进行了两轮案例研究,在
学位
随着监控设备的普及,作为智能安保、目标追踪等任务的重要辅助手段,行人重识别近年来被广泛研究。然而行人重识别任务在提取身份相关特征时存在的信息丢失问题会使得行人身份信息提取不够充分,进而影响行人重识别模型的准确度。基于局部特征的行人重识别方法能保留更多的局部重要特征,对遮挡问题也有较好的效果,但应对下采样导致的信息丢失问题存在不足。结合不同分辨率特征的方法在检测和分割任务中已广泛使用且被证明对下采样
学位
微颗粒存在于生活中的各个领域,在海洋生态领域中,微塑料会严重威胁海洋中生物和人类的生命健康。在船舶运输领域中船舶压载水携带的微藻细胞会严重影响当地的水域生态系统,因此微颗粒的检测对人类的生命健康和海洋生态系统平衡都具有非常重要的意义,而传统的微颗粒检测设备由于其操作复杂、体积较大、价格昂贵等因素不适合对微颗粒的快速检测,因而研发一套便携、高效的微颗粒检测设备具有十分重要的意义。本文提出了一种基于多
学位
在这个网络资源膨胀的时代,网络上的数据呈现出数据量大、表达多样和价值密度低等特征,数据的歧义性影响人们对于信息的辨别和理解。为了解决实体的语义歧义问题,实体链接技术被提出,其目标是根据文档中指称的上下文语义信息,链接一个文档的指称到一个知识库的相应实体。为了提高链接的准确率,实体链接方法需要同时考虑指称和候选实体之间的局部兼容性以及与文档中其它实体之间的一致性。本文针对当前大多数实体链接方法在获取
学位
在移动互联网和大数据迅速发展的时代,海量数据都是以自然语言的形式进行存储,这些数据蕴含着巨大的价值,但同时又存在大量歧义性。词义消歧可增强计算机使用和理解自然语言的能力,在机器翻译、文本分类、信息检索等领域应用越来越广泛。词义消歧已经演变成自然语言处理中亟待解决的重要课题。本文针对在整合词典知识的神经网络词义消歧模型中,存在忽略歧义词上下文和词义定义间层级交互作用的问题,构建基于混合神经网络的多粒
学位
图像配准在许多计算机视觉任务中起着重要的作用,例如海冰漂移跟踪等研究。但是图像受光照或成像条件等因素的影响,会产生一定的非线性变化灰度差异。例如遥感图像间由于数据来源、极化方式、分辨率等存在较大差异,使得待配准图像具有不同程度的非线性变化灰度差异。甚至于在不同光谱、不同波段的遥感图像中出现局部反色的情况。这种灰度差异往往呈现非线性变化,导致提取的同位置特征不能有效的进行匹配。针对非线性变化灰度差异
学位
为了辅助解决人口老龄化带来的人力不足问题,智能家居中的老年人日常行为识别系统应运而生。研究者通过在老年人的居住环境中部署相关传感器,获取其日常活动——比如睡觉、吃饭、吃药等信息,并利用行为识别知识处理这些信息,识别老年人日常行为,及时发现老年人日常行为中的异常。近年来,研究者们在智能家居日常行为识别领域取得了一定的成绩,但是还存在一些问题:(1)以往的研究方法大多统计传感器出现的频次,把频次进行相
学位
强化学习是人工智能研究领域中一个热门的方向,被广泛应用在机器人控制,人机交互等领域。深度强化学习将深度神经网络与强化学习相结合,在原有的强化学习方法上对智能体以及环境的预输入做特征提取。Actor-Critic算法作为深度强化学习的一个经典算法,在解决连续空间的问题上有着良好的表现。但是传统的Actor-Critic算法中Critic网络使用的是单一的Q-learning输出序列,智能体状态和动作
学位