面向本体标签知识图谱的样例查询方法研究

被引量 : 0次 | 上传用户:djkangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的爆发式增长,知识图谱作为一种语义网络,广泛应用于推荐系统、知识问答、社交网络分析等领域。在大数据时代,随着互联网的迅速普及,来自互联网中的海量数据,给人们带来宝贵数据财富的同时也给数据检索带来了巨大挑战。因此,如何对具有丰富语义信息的知识图谱进行高效的查询以获得用户感兴趣的结果引起了学术界以及工业界的广泛研讨,具有重要的研究价值与意义。早期针对知识图谱的查询主要是基于RDF三元组数据实现的,将RDF三元组存储到关系型数据库中,并利用结构化查询语言找到满足查询条件的结果。然而这对于非领域专家的用户而言,表达自己的查询意图和查询兴趣是非常困难的。基于图查询的方法使用户摆脱了学习复杂查询语言的困扰,只需要用户提供满足自己查询条件的图结构即可,其核心思想是子图匹配,通过图匹配在知识图谱中找到同构的子图作为答案。基于图结构的样例查询不会严格要求查询条件特征,将用户的查询视为用户感兴趣的数据示例,方便用户表达查询意图。传统知识图谱上的样例查询方法大多数是基于节点标签或边标签进行子图匹配。在具有丰富语义信息的知识图谱中,节点标签只能标识实体的名称及属性信息,并且相同的边标签可能连接着多种不同类型的实体。因此,基于传统知识图谱的样例查询会导致查询结果语义相关性低,返回的查询结果不能很好地体现用户查询意图。为了解决上述问题,本文提出将实体所属的类型与子类型作为节点的本体标签引入知识图谱中,并对本体标签知识图谱的样例查询方法进行深入研究,提出了面向本体标签知识图谱的样例查询方法。主要研究工作及创新点如下:(1)为了解决传统知识图谱上样例查询结果语义相关性低的问题,本文提出引入实体的本体标签集合即实体的所属类型以及子类型,作为对实体节点的语义描述。在目标数据集进行子图匹配的过程中,既考虑实体节点的本体标签相似性,又考虑边标签同构,以检索出语义相关性更高的答案。(2)针对用户输入单个查询图的情况,提出本体标签知识图谱上的单样例查询方法。第一阶段为过滤候选节点阶段,首先提出有效的双向索引和本体标签树索引提前缩小搜索空间,确定查询节点的候选范围。其次提出本体标签相似度计算公式,将候选节点按照本体标签相似度得分进行降序排序,形成有序的候选节点集合,便于优先验证相关性高的候选节点。第二阶段为验证阶段,首先通过边标签同构算法形成有序的匹配对集合,其次利用有效的候选结果组合排序算法直接组合形成前k个相关性最高的答案。(3)针对用户输入多个查询图的情况,提出本体标签知识图谱上的多样例查询方法。首先,利用本体-边标签索引缩小搜索空间,避免在整个知识图谱中进行搜索,提高查询效率。其次,为了优先返回紧凑程度更高的答案,根据用户查询样例集构建连通的匹配模式,为匹配验证做准备。再次,根据匹配模式在缩小的搜索空间中采用节点向量与索引结合的方式验证候选节点,进一步精确候选空间。最后在候选空间中评估匹配模式片段的候选基数,选择候选基数最少的结构进行扩展匹配以减少同构匹配次数,形成答案集返回给用户。(4)在多个真实数据集上进行多次实验验证,同现有的样例查询相关算法进行比较。实验结果表明,本文所提出的方法在查询效率、查询结果相关性、查询结果有效性、查询结果紧凑程度等方面都具有较好的表现。
其他文献
<正>随着我国新课程改革的不断深入,高中英语教师在开展教学活动的过程中,要重视学生语言能力、学习能力、思维品质和文化意识这四个核心素养。高中英语教学各个环节都应当注重这些核心素养的融入和渗透。阅读和写作是英语学习以及英语学科高考中的两大组成部分,阅读和写作的结合是培养学生核心素养的主要阵地,代表了英语学习中输入和输出的过程。英语阅读能为写作做必要的铺垫,反之写作也能延续和巩固阅读技能。本文主要分析
期刊
随着新课程改革的深度推进,英语教学要将推进学生英语核心素养发展放在首位。通过综合读写活动的设计,引领课堂新风尚,助力学生英语综合能力稳步提升。现从高中英语读写结合教学模式落实的理论基础分析入手,浅谈核心素养下英语学科读写结合教学对夯实学生阅读基础,提升学生文化素养,增强学生写作意识的多元引领价值。并从先读后写、以写引读、读写整合角度探索读写结合开展的方式,释放学生学习活力,提升学生语言逻辑,为学生
期刊
新时期课程改革背景下,英语教育越来越受到重视。在英语核心素养背景下,显著提升学生英语读写能力,增强英语素养。积极探索英语阅读与写作相结合的教学方法,本文针对核心素养背景下高中英语阅读写结合教学展开探究。首先阐明了读写教学重点,然后分析了读写教学难点,最后通过读写教学方法、读写教学过程、注重基础教学,丰富学生的英语词汇量等等展开一系列措施总结。
会议
随着信息技术的发展,大量网络应用的出现在方便用户获取资源的同时,造成了网络数据的爆炸式增长。当前,如何做到让用户从大量的信息中获取真正有价值、满足其需求的信息成为需要迫切解决的问题。因此,推荐系统成为了研究的关键点。推荐系统能够根据用户对项目的历史交互数据为用户提供符合其个性化需求的信息,其关键点在于推荐算法的设计。当前,许多先进的推荐算法不断涌现,并且已在各个领域内得到广泛应用。然而,推荐算法仍
学位
随着网络信息技术的快速发展,网购、短视频、新闻等平台的信息无时无刻不充斥着人们的生活,这些信息在便利人们生活的同时,也伴随着信息过载的问题。使用推荐系统是解决信息过载的有效方法。但是,传统的协同过滤推荐算法往往存在一些问题,例如当加入一个新用户时,或者训练数据过于稀疏,算法就会失效。为了克服上述难题,研究者们往往选择使用用户和物品的属性作为辅助信息以改善推荐算法的表现。后来研究者们发现,用户和物品
学位
大数据时代的到来,在便捷人类生活的同时,也使人们难以在繁杂的数据中找到感兴趣的信息,推荐系统的出现使这一问题得到有效缓解。近年来,将神经网络应用于图形数据的图神经网络发展迅速,其在解决各种图形面临的挑战方面显示出巨大潜力,因此大量的研究致力于将图神经网络应用于推荐系统,以解决推荐系统面临的挑战。然而,图神经网络在语义推理方面没有表现出明显优势,知识图谱包含项目之间丰富的语义关系,可以对语义进行有效
学位
目前,越来越多的方法聚焦于利用图神经网络挖掘知识图谱的语义信息,基于图神经网络(GNN)挖掘知识图谱语义信息是目前主流的方法。GNN挖掘知识图谱语义信息的思路是将知识图谱的节点ID和边ID映射到一维空间,通过图卷积运算融合邻居节点嵌入和中心节点嵌入,在图卷积运算中引入注意力机制赋予邻居节点一定权重。然而大多数方法没有根据用户具体的兴趣偏好聚合邻居结点的语义信息、也没有对知识图谱学习得到的节点嵌入表
学位
为了解决由于能源消费侧数据多元化导致的数据安全监测精度低的问题,提出了基于客户画像的多元化能源消费侧数据安全实时监测方法。以收集不同客户的能源消费数据为基础,分析客户的消费规律,并利用设置标签的方式生成客户画像,提取用户实时能源消费数据的变化特征,从而实现多元化能源消费侧数据安全实时监测。实验结果表明,所提出的方法可有效地降低能源消费侧数据的监测误差,即设计的数据安全实时监测方法在监测精度方面具有
期刊
近年来,政府和企业越来越注重对数据进行理解、分析和总结,但是由于数据规模庞大、类型繁杂、整理及维护成本高等问题,大部分数据的显性知识和共性问题不能被充分挖掘和分析,办公人员难以全面高效的工作。构建知识图谱可以达到对大规模数据挖掘和管理需求。基于半结构化和非结构化文本的三元组自动抽取是构建知识图谱核心,其中包含两个子任务:命名实体识别,关系抽取。本文工作主要包括以下三个方面:(1)对于中文实体识别任
学位
传统推荐算法主要基于用户-物品交互数据并利用协同过滤进行推荐,当面临用户-物品交互数据稀疏时,由于缺乏协同信号而极大影响推荐性能。目前一种有效的解决方案是设计合适的图神经网络框架引入知识图谱信息,但在信息建模和融合方面还存在不足。因此本文基于用户-物品交互数据与知识图谱构造图结构数据,使用图神经网络技术,从知识图谱中关系建模、知识信息与协同信息融合两个方面提出了改进的知识图谱推荐算法。首先,在知识
学位