基于知识图谱的实体关系补全方法研究及应用

被引量 : 0次 | 上传用户:lyyzk09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迭代更新,越来越多的数据被存储于云服务器和个人终端设备上,不论是图片、视频、音频或是文本数据都是非结构化的,因此它们不能很好的被计算机识别或使用。知识图谱以结构化的形式保存数据,让计算机可以有效地应用这些数据,目前知识图谱在搜索引擎、问答系统、知识推理等领域已经成为了不可或缺的技术。但是知识图谱的构建与维护是一个漫长的工作,需要相关领域内的专家们不断地完善。因此知识图谱补全成为该领域的热门研究方向,它致力于预测缺失的实体与关系,自动完善知识图谱的结构,使其在下游应用中更好的发挥作用。它可以减少大量的人工标注工作,是现在知识图谱构建里一项重要的技术。本文基于初等数学自然语言理解系统,该系统的工作是将非结构化的数学题目理解为结构化的三元组表示。此系统因为设计以及实现上的限制导致了此过程存在知识表示上的缺失问题,因此,本文针对这些问题提出了两种知识图谱补全方法,目的是完善该系统对数学文本题目的知识表示。综上所述,本文的工作主要包含以下几个方面:(1)分析了初等数学自然语言理解系统中存在的知识表示缺失问题,主要存在两方面的知识无法抽取,第一个是文本题目中未提及的隐含实体无法抽取,第二个是关系标注数据集规模以及相似度阈值过高导致的正确关系无法被抽取。(2)提出了基于规则的实体自动补全方法,主要针对隐含实体进行补全。定义了实体补全规则的标准,设计了一个根据规则进行实体补全的框架,实现了对规则的解析以及三元组的自动生成。(3)提出了基于深度学习的关系自动补全方法,主要针对缺失的关系进行补全。设计并训练了一个深度学习模型,在该模型中,引入外部的实体嵌入向量增强实体表示。使用标注好的题目三元组样本训练模型,并将训练好的模型应用于数学知识图谱的补全任务中。(4)构建了融合实体自动补全方法与关系自动补全方法的知识图谱补全模块,应用于初等数学自然语言理解系统中,分别测试了两种补全方法补全的三元组正确率,其中实体自动补全方法的正确率在93%左右,关系自动补全方法的正确率在75%左右,该模块使整体系统的解题通过率提高了30%左右。
其他文献
随着数据的爆发式增长,知识图谱作为一种语义网络,广泛应用于推荐系统、知识问答、社交网络分析等领域。在大数据时代,随着互联网的迅速普及,来自互联网中的海量数据,给人们带来宝贵数据财富的同时也给数据检索带来了巨大挑战。因此,如何对具有丰富语义信息的知识图谱进行高效的查询以获得用户感兴趣的结果引起了学术界以及工业界的广泛研讨,具有重要的研究价值与意义。早期针对知识图谱的查询主要是基于RDF三元组数据实现
学位
报纸
稀土是现代工业中至关重要的战略性资源,稀土分离是稀土资源综合高效利用的重要基础。大量的稀土萃取分离实践经验表明,混合澄清槽的体积平衡和流量平衡问题对萃取分离生产线的控制至关重要,是构建稀土萃取分离智能控制系统的关键环节。随着生产线运行状态的调整变化,混合澄清槽中的两相体积和流量也在不断变化,并且这种变化具有显著的非线性和滞后性特征,槽体的体积平衡和流量平衡控制会直接影响萃取分离生产线输出的稀土产品
期刊
推荐系统是互联网公司重要的增长引擎。推荐系统通过分析用户的历史行为数据来为用户推荐其感兴趣的物品。优秀的推荐服务可以增强用户的黏性,提高用户的转化率。推荐算法是推荐系统的核心,其负责数据的处理以及推荐模型的构建。传统的推荐算法存在数据稀疏、冷启动,以及推荐多样性差等问题。知识图谱因其具有丰富的知识内容和强大的关系处理能力,可以有效解决这些问题。基于知识图谱的推荐算法是近几年的研究热点。现有工作大都
学位
隧道火灾一旦发生,火势迅猛,救援难度高,危害性极大。传统隧道火灾检测方法,如感温电缆等,需要达到一定温度才能报警,时间冗长。应用深度学习等方法实时快速的检测出隧道内出现火焰等情形,将火灾扼杀在萌芽阶段。深度学习,从更深层次自动挖掘特征并分析,应用于火焰检测是这一领域的新思路。本文以解决传统隧道火灾检测方法速度慢、误检率高等问题为目标,首先针对小火焰目标,提出了一种YOLOv5s-SRGAN级联网络
学位
文本分类是对数字文本信息按照一定的分类体系或标准进行自动分类标记的一种方法,常用于垃圾邮件处理、情感分析、主题分类、意图识别等自然语言处理领域。目前常用的方法是基于深度学习的文本分类方法,此类方法是基于单模态数据所驱动的统计学习方法,缺乏对数据的真实理解能力,鲁棒性较差,单模态的信息也难以有效分析互联网中越来越丰富的多模态化数据。针对此问题,本文采用两种策略来提高分类能力:(1)为文本分类模型引入
学位
随着互联网的快速发展,网络数据呈现出爆炸性的增长趋势,如何从海量异构的信息中找到用户感兴趣的内容是当前研究的热点。推荐算法作为数据挖掘的重要分支能够有效地缓解信息过载的问题,已成功应用于电子商务、新闻媒体和饮食健康等领域。以协同过滤为代表的传统推荐算法仅根据用户的评分数据进行建模,往往面临着数据稀疏和冷启动等问题。对此,研究人员提出将知识图谱作为辅助信息引入推荐算法中,通过丰富用户或项目的语义描述
学位
人类文明中最伟大的结晶莫过于教育,俗话说为“天地立心,为生民立命。为往圣继绝学,为万世开太平”,教育是人类社会走向文明的核心,教育的水平关乎一个民族的文明传承,一个国家的繁荣昌盛,甚至关乎世界的和平发展。古人说“有教无类”,教育的客体是数量庞大的青少年学生,每个学生在人类历史上都是独特的个体,每个学生的擅长领域不同,学习能力不同,所以在现代社会的教育中,大多数老师公认的优良教学方法都是根据学生的能
学位
电梯首次检验不合格率能够极大程度反应出电梯日常维保质量,本研究通过历史三年的电梯定检数据,并结合电梯设备信息、品牌信息以及检验不符合项信息,构建历年最优聚类模型,通过从电梯品牌、安装单位、使用年限、不符合项四个维度分析不合格检次分布情况,找出常年维保质量较低的重点监管维保单位,并且排查出了频繁出现的不符合项及反复出现该问题的设备,为监管提供标靶。
期刊
推荐系统作为一种从海量信息中筛选出用户需要的信息的有效手段,有着丰富的实用价值。引入辅助信息的推荐算法可以获得更好的精度,其中基于知识图谱的推荐算法引起了广泛关注。但是通过本文的研究发现目前对于基于知识图谱的推荐算法来说,还存在一些地方有待完善。首先,现有的方法在利用用户的历史记录在知识图谱中传播时,没有对物品粒度的信息进行挖掘,并且不能区分历史记录中不同物品的重要程度。其次,现有方法没有考虑到用
学位