基于概率推理的知识图谱链接预测

来源 :云南大学 | 被引量 : 0次 | 上传用户:liarcher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱(Knowledge Graph,KG)以强大的语义处理能力与开放互联能力成为人工智能领域研究的热点。然而,KG中的知识并不完善,部分实体之间缺少链接,导致KG的使用受到极大的限制。KG的链接预测任务旨在为实体间缺失的链接进行预测,其中,根据KG中的知识计算实体间存在链接的可能性,预测缺失的实体链接,是KG链接预测的核心任务之一,也是本文研究的链接预测问题。KG中的实体之间存在着相互依赖关系,且具有不确定性,如何描述不同实体间的隐含链接关系、并对其存在的可能性进行定量度量,是准确预测实体间存在链接的重要保证。基于规则挖掘发现缺失链接是一种有效的KG链接预测方法,然而,该方法不能有效发现实体间隐含的关联关系并对其进行量化,难以全面准确地实现KG的链接预测任务。为此,本文以描述实体间隐含关联关系并度量链接存在的可能性为目标,基于AMIE算法挖掘KG中的规则,并将其转换为Horn子句。进一步,以贝叶斯网(Bayesian Network,BN)这一概率图模型作为描述KG实体间不确定依赖关系的表示和推理框架,利用Horn子句构建描述实体间相互关联的规则链接贝叶斯网(Rule-Link Bayesian Network,RLBN)。把KG的链接预测任务转换成RLBN的概率推理任务、计算实体间的关联度,作为链接存在的依据从而实现链接预测任务。本文的主要工作概括如下:(1)针对查询实体,利用AMIE算法挖掘KG中描述查询实体与候选实体集依赖关系的逻辑规则,设计加权函数计算规则的权值,并提出了抽取最优规则关联实体集的分支限界算法,获取与查询实体关联的实体集。(2)为了构建RLBN的结构,将查询实体的规则关联实体集表示为Horn子句并等价地转换为有向无环图。此外,提出概率分配函数并利用Horn子句中的逻辑约束来计算各节点的条件概率表。(3)为了高效地完成链接预测任务,本文基于BN推理机制提出RLBN的近似推理算法,计算实体间的关联度,并将其作为预测链接存在性的依据。(4)基于不同规模、类型的数据集上,选择多组对比方法,对RLBN的链接预测方法及模型的构建进行了实验测试,实验验证了模型的有效性和高效性,并且为了更加直观地展示RLBN模型,本文设计并实现了简单的模型原型系统。
其他文献
We Are Social和Hootsuite合作发布的《2022全球数字洞察报告》显示,全球的社交媒体用户已经达到46.2亿,约占全球总人口的58.4%,较去年同期增长了10%以上。在这个社交媒体蓬勃发展的时代,越来越多的用户通过自己的社交账号,将个人的看法或体验以图片和文本的形式来分享给他人。这类带有用户丰富情感的多模态数据有利于了解人们对某一事件看法,在政治选举、大盘走势、票房预测及情绪干预
学位
图像修复是指用一系列方法恢复破损图像。针对现有修复方法存在的问题,提出了两种图像修复算法,主要工作内容如下:针对现有算法在背景复杂和大面积不规则破损的修复条件下,修复结果存在结构不合理和纹理细粒度低的问题,提出基于密集多尺度融合扩张卷积的图像修复算法。首先,将破损样本输入全局结构生成网络中,该网络的核心模块为密集多尺度融合扩张卷积块;其次,将结构生成网络的输出样本输入至细节生成网络中,该网络包含密
学位
切口疝是腹部手术之后,由于创口感染、恢复不佳或运动过量等因素导致手术切口的下方形成腹壁缺损,该缺损一旦形成无法自愈,且具有日益扩大的趋势,严重影响患者的生活质量。目前,通过外科手术在腹壁缺损处植入补片,以承受原腹壁缺损区域与周围组织之间张力的手术方法已成为切口疝标准的治疗方案。基于体内异物残留最小化的发展趋势,疝修复补片逐渐轻量化。但因腹内压或剧烈运动,体内的补片可能会产生移位、皱缩和卷曲等情况,
学位
中国农作物种类繁多,农作物产量和质量影响着经济发展和农民收入,农业健康稳定发展一直是国家追求的目标。因此快速准确识别农作物病害种类并及时给予准确防治至关重要。传统农作物病害图像的识别主要靠少部分农业专家从病害图像的颜色和形状进行识别,这样既费力效率又低,也比较主观,容易导致误判错过最佳治疗时间。而现有农作物病害图像识别研究方法主要是从图像背景分割、机器学习相结合进行病害识别,但图像背景分割难度大、
学位
在城市化、工业化背景下的“陌生人”社会,专业化、组织化的现代慈善事业凭借着信息优势得以蓬勃发展。互联网、智能手机等技术的不断进步在日益丰富慈善参与方式和渠道。网络募捐的“指尖公益”凭借门槛低、操作便捷、募款高效等特性获得越来越高的社会参与度和关注度。与网络募捐兴起相伴的是骗捐、诈捐事件层出不穷,一些网络平台遭遇认同危机。追根溯源,无一不是网络募捐平台多方参与主体之间信息分布不对称的结果。如何解决网
学位
针对现有深度网络修复大面积随机缺失区域时存在修复结构不合理、生成细节模糊等缺陷,本文提出两种改进的修复模型:基于并行卷积的双阶段对抗网络图像修复与基于多尺度信息融合的单阶段对抗网络图像修复。论文主要贡献如下:针对现有算法在修复大面积规则掩码时出现的结构信息不连续和语义信息缺失的问题,提出一种基于并行卷积的两阶段修复模型,该模型由并行卷积组成的粗修复网络和融合残差连接与注意机制的细修复网络组成。首先
学位
下肢静脉曲张产生的主要因素是由于静脉壁薄弱、瓣膜功能障碍和静脉内气压的不断增加,进而影响血液回流,从而导致静脉延长、产生迂曲、扩张等的临床症状。静脉曲张的最主要治疗方法是外科手术,由于通过外科手术可以根治静脉曲张,因而术前检查和个性化治疗方案的制定在静脉曲张的诊治过程中显得尤为重要。目前在临床上主要采用彩色多普勒超声、下肢数字减影血管造影(Digital Subtraction Angiograp
学位
上世纪70年代后期,英国生物化学家Frederick Sanger研发了第一代基因组测序技术,开启了基因组学新纪元,为探索生命的本质奠定了基础。经过科研人员的不断完善,测序技术历经三次迭代,至今仍然不能直接测得完整的基因图谱,只能先将完整的基因截取为不同长度的read(碎片),随后测得read序列,通过拼接技术将这些read拼接为完整的基因组图谱。完整的基因组图谱在分析遗传变异中发挥着重要的作用,
学位
图像分类技术是深度学习领域的一项重点研究方向。本文将深度神经网络应用于对医学图像的鉴别与诊断,研究内容主要是在传统卷积神经网络(Convolutional NeuralNetwork,CNN)的基础上做出改进,提高网络的效果。本文在重楼显微数据集和溃疡性结肠炎数据集上进行了具体研究。在对重楼显微图像的鉴别中,本文在基于传统CNN模型上加上了不同的注意力模块,其原理是可以模仿人眼观察物体一样在扫描整
学位
说唱音乐充分表达了作者对生活、对社会的态度,说唱音乐的传播可以帮助人们提高自我意识,弘扬中华民族的传统文化。然而中文文法和句式结构的复杂性使得中文说唱歌词领域的研究进展十分困难。说唱歌词生成是文本自动生成任务的特例,基于主题的说唱歌词生成技术不仅要求生成的说唱歌词满足文本的流畅性、可读性和内容性,更限制文本内容必须是主题相关性的。这对文本生成模型提出了巨大的挑战。本文首先明确了当今说唱歌词生成算法
学位