基于知识表示学习的实体对齐技术的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:meimeilaile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各类信息数据也随之爆发式的增长,这些海量的碎片化数据作为重要的信息资源,被整理为结构化的知识数据并以知识图谱的形式管理,可以广泛应用于语义智能搜索、知识问答、知识推理等领域。由于互联网世界的开放性,很多机构或组织都会根据自身的需求和理念去构建知识图谱,那么不同知识图谱间也会充满多样性和异构性、并且其数据中会存在很多语义重复的实体或者关系。如果要对多个知识图谱相互关联从而构建更大规模的知识图谱,就必须进行知识融合,其中的关键技术就是实体对齐。传统的实体对齐工具存在着大量的不足,其提供的实体对齐算法适用范围非常有限,并且效率较低,不能满足用户多样性的任务需求;并且缺少友好的人机交互界面,工具的使用门槛较高、用户体验较差。本文针对传统实体对齐工具存在的不足,对基于知识表示学习的实体对齐方法进行研究,发现其不受语言学特征、结构信息的限制,可以不依赖字符串信息而获取到文本固有的语义信息,提出了一种基于神经张量网络的跨知识图谱实体对齐算法,并开发实现了一个知识图谱实体对齐系统,本论文的主要研究成果包括:(1)提出了一种基于神经张量网络的跨知识图谱实体对齐算法,分为联合知识表示学习和改进型NTN对齐模型。联合知识表示学习方法基于种子集对多知识图谱进行知识表示学习,将种子集的对齐关系视为实体之间的特殊关系作为对两个知识图谱合并的约束,从而将两个知识图谱糅杂在一起,再使用知识表示学习方法实现两个知识图谱在统一低维空间的向量化表示;改进型NTN对齐模型用于计算待对齐实体对向量之间的相似性,从而推断评判两个待对齐实体对间是否存在对齐关系,实现跨语言知识图谱实体对齐。本论文方法在DBP15k数据集的实验效果其Hit@10指标最高达到了 79.20,MRR指标达到了 0.511,结果表明该算法与传统算法相比性能较优。(2)设计并实现了一个知识图谱实体对齐系统,封装了本文提出的基于神经张量网络的跨知识图谱实体对齐算法,将其用于在线实体对齐计算任务并预留了接口,便于对其他实体对齐算法的扩展,实现了高效的数据缓存以及知识图谱数据的存储,并且提供了良好的人机交互界面。测试表明该知识图谱实体对齐系统总体满足了系统的设计目标,拥有较好的稳定性、用户友好性、高效性、灵活性。
其他文献
硬膜外阻滞行阑尾切除术中,牵拉或处理阑尾时,病人常诉胸口疼痛、恶心、呕吐、鼓肠,有的甚至出现血压下降,心率减慢等反应。为防止阑尾牵拉反应,我们将穿刺点由原来T12~L1提
期刊
电压跌落是配电系统常见的问题,发生电压跌落会造成很大的经济损失,STATCOM可以对其进行快速补偿.本文重点讲述了连接电感和直流侧电容参数对直流侧电压的影响,采用电流间接控制
目的观察肝硬变患者对胰高糖素负荷后的血糖反应能力.方法38例肝硬变患者按Child-Pugh肝功能分级,分为A级(10例)、B级(14例)及C级(14例)三个亚组.11例健康者为对照组.清晨空
考虑如下积分方程组﹛u(x)=∫nR1/|x-y|n-αup1(y)vp2(y)dy,v(x)=∫nR1/|x-y|n-αuq1(y)vq2(y)dy,其中0〈α〈n,1≤pi,qi≤(n+α)/(n-α)(i=1,2).利用积分形式的移动球面法及Hardy-Littlewood-Sobolev(H
目的 比较显微镜下锁孔手术血肿清除及血肿穿刺针用于微创颅内血肿清除术治疗幕上型高血压脑出血的两种不同手术效果。方法240例高血压脑出血患者随机分为两组,第1组采用显微
建筑工程档案资料属于建筑企业的宝贵财富,是建筑企业在施工过程中经验与施工技术的积累,在建筑工程管理中发挥重要的作用。有效地对档案资料进行管理,不仅可以提升建筑工程
基于PCI1010运动控制卡开发一套卡车翻转机构自动下线系统.首先根据系统需求设计系统的总体运动控制方案;然后根据翻转机构的结构特征、生产线的档位需求等设计自动下线系统
进行景观偏好理论与应用的研究,对于了解公众偏好的自然因素和设计质量并将其纳入规划和管理具有重要的现实意义。以景观偏好为议题,回顾了近20年国外景观偏好相关研究,对景
随着科学技术进步,社会经济发展,大众物质生活水平在不断提高的同时,对于精神文化生活方面的需求也在不断发展着,由此在大众精神文化生活方面占据着重要位置的广播电视传媒行