融合外部文本信息的知识表示学习研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:knighthaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是人工智能的重要组成部分,能够更好的组织、管理和理解互联网中海量的信息并且以其强大的语义处理能力和开放互联能力将这些信息以结构化的形式呈现给人们。三元组“实体,关系,实体”是知识图谱的一种通用的表示方式,实体通过关系相互连接构成语义网络并以符号形式或者网状结构存储在知识图谱中,但是这样的表示方式却存在数据稀疏和计算效率不佳等问题,因此如何更好对知识图谱中的知识进行表示是提升知识图谱质量的关键。随着深度学习领域的走红,表示学习技术也逐渐受到人们关注,面向知识图谱进行表示学习成为构建高质量知识图谱的基础。知识表示学习旨在面向知识图谱进行表示学习,将知识图谱中的实体和关系映射到低维稠密的向量空间,在该向量空间下,实体和关系都被表示成向量形式,便于计算它们之间的语义关系和发现更深层次的语义联系。该技术可显著提升计算效率和缓解数据稀疏问题并实现多源异质信息的融合,对知识库补全和知识推理等下游任务的质量有很大提升。以往的知识表示学习技术都只利用了三元组本身的结构信息,但是知识图谱中还包含了大量的实体和关系描述信息、类别信息,甚至互联网中还存在大量未被加入到知识图谱的文本信息,这些信息都能够提升知识表示的区分能力却还未被发掘和利用。基于以上原因,本文将采用知识图谱的实体描述信息来增强实体的表示,从而提升知识表示的质量,主要工作如下:(1)在实体的表示学习过程中,引入实体的文本描述信息。实体描述信息是一种对实体的简单介绍,通过描述信息可以得知实体的属性和定义,将实体描述信息的文本表示与实体的结构信息相结合,使实体的表示包含更多的语义信息。(2)提出一种基于文本监督的表示学习模型TBTS,首次将Transformer结构引入知识表示学习中,利用部分Transformer结构学习实体的描述文本的表示,并对不同的注意力机制分配不同的权重,以最大化利用到不同子空间的信息。(3)利用对抗生成网络的思想,利用其他模型作为生成器来为模型提供更优质的负样本,解决“假负例”问题和“零损失问题”,从而提升模型训练的效率。模型在FB15K和WN18两个数据子集上进行实体链接预测和三元组分类任务实验,实验结果表明在两个评价指标上优于其他对比模型,证明模型能够利用文本信息对现有的表示进行提升。
其他文献
据世界卫生组织统计,截至2016年,全世界约13%的成人为肥胖,其中女性肥胖发生率为15%;男性肥胖发生率为11%,肥胖成为非传染性疾病,如心血管疾病、糖尿病和某些癌症的重要危险
<正>阿尔茨海默病是世界性难治病。2014年月新疆维吾尔自治区中医医院申报了国家中医药管理局中医临床诊疗指南制修订项目"阿尔茨海默病中医临床诊疗指南修订"。在专家组的指
会议
目的通过对中国科学引文数据库(CSCD)近年收录的中医学论文进行统计分析,了解中医学科发展现状。方法计算机检索2010年1月-2015年12月CSCD收录的中医学相关文献,采用CSCD文献分析
由于不同民族有不同的历史、信仰、风俗习惯及价值观念,因此不同语言中的动物名词也具有不同的内涵。文章以英汉习语为例比较分析了英汉两种语言中的动物名词的不同文化内涵
本文以2009年中小板上市公司作为研究样本,考察内部审计特征对公司信息披露质量以及获利能力的影响。结果显示,内部审计独立性越强,隶属的层级越高,其信息披露质量也会更高,
《史记》作为纪传体通史,体制宏大,内容精深,其史学价值获得了人们的广泛认可,自成书后历朝历代都有研究者将之奉为史学经典。《史记》以“实录”为本,同时也再现出大量鲜活
随着大力发展清洁能源成为研究主流,远离陆地、风能丰富的海上风电场越来越成为关注的焦点。含有高压交流海底电缆的近海风电场由于其较大的充电功率的特点,对其无功补偿研究
微粒贷是腾讯旗下微众银行推出的首款互联网信贷产品,已正式上线运行半年多,为部分微信和QQ用户带来了融资便利。同时,许多用户也对微粒贷的征信报告查询授权和信贷数据上报
<正>心源性休克(cardiogenic shock)指心脏泵血功能衰竭而引起的休克,是由于心脏排血功能障碍,不能维持其最低限度的心排血量,导致血压下降,重要脏器和组织供血严重不足,引起
政府购买作为一种公共体育服务创新机制,如何才能最大限度实现公共体育服务供给的公平?即应该遵循怎样的资源分配伦理?在政府购买公共体育服务实践中有没有产生伦理偏差?如果