面向长尾实体的开放式知识丰富方法

来源 :南京大学 | 被引量 : 0次 | 上传用户:macgrady2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义网技术的不断演进和发展,推动了机器对Web数据的智能化理解,并催生了众多的知识图谱。知识图谱以符号化的形式描述现实世界中的实体及其相互关系,结构化地存储着大量描述实体事实的知识。时至今日,知识图谱已经成为各类以知识为驱动的人工智能应用的宝贵资源。现有大型开放知识图谱尽管体量很大,但它们被广泛认为是不完备的,本文研究发现这种不完备很大程度体现在长尾实体事实的缺失。为了提高知识图谱的完备性,研究者们从多个角度展开探索,很多相关工作被提出。然而,现有工作缺乏对长尾实体的关注,对于长尾实体知识丰富的表现十分有限。鉴于长尾实体当前在知识图谱中事实稀少,基于知识图谱嵌入技术的链接预测方法将很难学习到这些长尾实体的高质量嵌入。知识抽取的方法因为信息量不足,不能很好地处理错误或异常。其他方法则仅针对单一目标设计并实现,并非知识图谱自动丰富的完整解决方案。与已有方法对实体不加区分不同,本文针对性地关注知识图谱中长尾实体的知识丰富,并提出了一个完整的解决方案OKELE,旨在利用知识图谱中知识相对完备的流行实体以及Web上大量的开放数据来丰富长尾实体的知识。本文提出了一种属性预测模型,其有效结合了图神经网络和注意力机制,通过比较相似流行实体来预测长尾实体的缺失属性;本文探索了多种类型的Web数据的属性值抽取方法,并使用流行实体强化数据源检索和信息抽取;本文提出了一种基于共轭先验的概率图模型来评估数据源的可靠性,验证事实真值。实验结果表明,本文提出的解决方案有效适用于长尾实体的知识丰富,方法中的属性预测模型和真值验证模型在效果上均优于对比模型。
其他文献
在微波电路设计中,计算电磁学中的有限元数值仿真算法发挥着极其重要的作用。有限元数值仿真第一步是对仿真器件进行建模并且离散,考虑精度的要求,势必会加密剖分进而构建出
黑龙江东部三江盆地处于佳依断裂、敦密断裂和那丹哈达地体之间,是受郯庐断裂与太平洋板块运动共同作用的特殊位置。三江盆地新生代的演化是对郯庐断裂活动和太平洋板块下插的响应。三江盆地富锦地区和饶河地区存在大量正地形,其隆升剥露过程能够反映盆地的演化。本论文运用流域特征分析、LA-ICPMS磷灰石裂变径迹法及热历史模拟,对三江盆地新生代的隆升剥露过程进行了分析。流域对构造活动十分敏感,因此流域地貌指数对流
基于手指动作的s EMG人机接口,结合脑-机接口的视觉刺激界面,是一种人体通过手指弯曲动作与外部终端环境设备进行会话的交互方式。手指弯曲动作是一种精细动作,这种新型的交
随着科技的进步以及社交网络的不断发展,影响最大化问题逐渐成为了社交网络中的关键问题。而传统的影响最大化问题已经不能满足当前应用场景多样化的需求。因此个性化影响最大化作为社交网络影响最大化的一个分支出现在人们的面前。个性化影响最大化问题就是以特定的社交网络用户作为对象,挖掘使其受影响程度达到最大的初始影响传播用户集合。本文从传播模型的方面考虑,对个性化影响最大化问题展开了探究,分别提出了基于多重级联
工业4.0的到来不仅要求机械设备更加智能化,也对机械设备的可靠性有了更高的要求。本文以机械设备运行状态信息为基础,以信号处理技术为主要手段,分别从信号采集、状态特征提取和运行可靠性评估三方面着手,提出了基于最小熵解卷积-快速变分模态分解、模糊近似熵和模糊支持向量数据描述的运行可靠性评估方法。首先,针对机械设备早期损伤状态信息易受到强背景噪声干扰而不易被提取的问题,提出一种基于最小熵解卷积-快速变分
非认知能力对个体劳动力市场表现和和社会行为的重要作用已不断被认识。家庭作为最基本的社会组织或社会制度,是儿童青少年最重要的社会化场所,与儿童青少年非认知能力发展关
科学的教学评估有利于促进教师不断提升其执教水平、专业素质、以及师品师德等。现阶段我国高职院校的教学评估工作大多依赖学生成绩和领导评价,评价过程中有过多的人的主观
互联网技术的发展使传统教育模式逐渐向网络教学模式转变,学习者的情绪作用备受研究者关注,但情绪研究在网络教学系统设计中存在局限性,缺少以用户情绪状态去指导系统设计的
在进入互联网时代以来,有许多的新型概念被提出来,不论是工业上的,商业上的,等等。在新时代的背景下,系统化、自动化、规范化已经成了所有企业、工业的基本特征。虽然目前已
以Ga N、Si C为代表的第三代半导体材料具有宽禁带、高击穿电场、高热导率、高电子饱和速率等特点,但其服役环境较为复杂,这对器件的连接材料及连接可靠性提出了更高的要求。