一种基于表示学习的知识图谱融合算法与系统实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xueyueer001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着语义网的发展,越来越多的结构数据以知识图谱的形式公开发布,并广泛应用于信息检索、推荐系统、问答系统等领域。知识图谱作为语义数据的重要组成部分,通常包含了大量相互重合的RDF三元组信息,然而只有少量实体之间存在等价链接。所以,如果要同时使用多个相互关联的知识图谱,就必须将实体进行对齐或者合并,其中的关键技术就是实体融合。由于不同知识图谱之间存在着数据的语义不均一性,实体和属性的表示有许多变种和歧义,这给实体融合技术带来了巨大的挑战。  实体融合算法主要基于语言学特征、层次结构、属性值域、辅助数据源、机器学习、知识表示学习等。一般地,基于语言学相似度的算法比较难于应用在大规模的数据集当中,机器学习相对灵活,但是依赖于训练数据和优化算法,知识表示学习能够脱离实体的文本信息,根据RDF三元组之间的结构特征对实体进行编码。传统的实体融合工具提供的匹配算法通常非常有限,不能满足用户的多样性需求,且缺少友好的用户界面,对于普通用户来说,使用门槛较高。  本文提出了一个基于知识表示学习的双向监督迭代融合算法,将实体和属性映射到了同一个低维的向量空间。与传统方法相比,该算法避免了对知识图谱的糅合操作,并实现了跨语言知识图谱实体融合。同时,还实现了一个基于Web的实体融合工具,提供了良好的交互界面以及详细的操作指南,实现了高效的在线融合计算与数据传输。该工具提供了多种融合算法,包括语言学距离度量、基于正样本的机器学习以及知识表示学习。
其他文献
跨入21世纪以来,随着信息技术、计算机技术、网络技术等高科技的不断发展,企业的信息化的步伐也逐渐加快,从通常的手工操作到办公自动化套件的广泛应用,再到各式各样企业管理
随着网络时代的发展,人们对信息资源掌握的增多,导致需要存储的数据量以几何级数在增长,网络带宽的不足、存储资源的紧缺以及等等诸多问题随之而来。解决这些问题的有效手段
随着计算机网络及相关技术的发展与普及,网络购物、网上支付、手机支付等等网络经济操作渐渐走近了大众的生活,网络安全问题已经直接影响到社会经济生活。在网络安全领域,网
随着计算机与信息技术的发展以及相关应用领域的需求,人脸检测与跟踪及其相关技术吸引了众多的研究者,国内外关于人脸检测和人脸跟踪的方法多种多样,并且不断有新的研究成果
计算机与互联网技术的快速发展,带来了一场计算机软件领域的技术革命。从PC时代的单机软件,到互联网时代的分布式软件,再到如今云计算时代倡导的软件服务,计算机软件的应用得到了
目前对等网络面临的重要问题就是如何高效的定位网络中的资源,基于DHT的结构化路由算法的提出使这一问题得到了相对优化的解决方案。本文针对典型结构化P2P路由协议Chord展开
当在数据库设计过程当中引进了一项新技术,必须在不同操作系统环境下测试新数据库系统的性能。通常,数据库测试会选择一套复杂的数据集和SQL查询集,并分别在引进新技术前后的数
随着社会的不断发展和工作压力的不断增加,旅游成为了人们释放压力和享受生活的一种方式。人们的文化程度越来越高,在观光旅游时不仅寻求美丽的自然景观,还期待着丰富的文化
互联网技术已广泛应用于民航、铁路以及道路旅客运输联网售票领域,尤其是互联网汽车票联网售票迎来飞速发展阶段。汽车票联网售票系统建设的前提是在互联网上获取该类主题数
本文将在比较与分析当前无线平台搭建技术的基础上,构建一个基于J2ME/J2EE平台以及GPRS网络的移动学习系统,以扩展网络学习系统无线领域的应用。本文研究的重点在于如何设计