面向知识图谱嵌入的时序实体对齐技术研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:jiangyang0266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展,催生了大量平台级的应用服务,如搜索、推荐、查询等。为了向用户提供更加精准、高效的服务,众多互联网平台分别构建了面向不同应用场景的知识图谱。知识图谱是一种组织结构良好、可解释性强的人工智能技术,能高效地组织并表示各种信息,因此得到了广泛的应用。但面向各不同网络应用的知识图谱通常是独立构建的,因此存在相同的信息表述不一致以及数据的更新时间不一致等问题。将不同时间的知识图谱中表述形式不一致的实体进行时序对齐,进而实现众多网络平台间的时序信息融合,对情报发现、案件侦破、金融风控、网络安全等具有重要作用。但是,传统的实体对齐方法没有考虑实体的时序信息,在知识图谱动态变化且更新状态不一致的情况下,不能有效地进行知识图谱间的知识融合。因此为了实现动态变化的知识图谱间的协同作用,本文基于知识图谱的节点中心性算法和动态知识图谱嵌入算法,提出了基于时序种子实体的动态知识图谱嵌入算法Hy SE和基于嵌入的时序实体对齐算法Dy SEA,并基于Dy SEA实现了一个面向人物的时序实体对齐系统。在算法层面通过实验验证了本文所提方法的有效性,能较好地实现动态变化的知识图谱间的时序对齐融合,时序实体对齐系统也证明了本文所提出的方法在实际场景中的有效性,解决了人物间的时序实体对齐的问题。本文的研究点和创新点主要有以下几点:1.动态知识图谱嵌入算法Hy SE:提出了一种优化种子实体选择的方法,通过选择的种子实体连接起不同的动态知识图谱向量空间,通过实验证明了在提高时序实体对齐效果的同时,也能把对链接预测等其他任务的负面影响维持在较小的范围内;2.时序实体对齐算法Dy SEA:改进动态知识图谱的嵌入方法和负采样过程,通过两种相似度方法进行时序实体的对齐,实验结果表明该方法比最新的算法在精确率、召回率、F1值等指标上分别提升了27%和48%、10%和3.4%、15%和20%,证明了本文所提方法的优越性;3.时序实体对齐应用系统:基于时序实体对齐算法,设计并实现了一个精准人物简历系统,该系统共包含24756个实体、29种不同的关系和32768条元组信息,能准确地实现同一人物不同数据源以及不同人物间的实体对齐,证明了所提方法的有效性。
其他文献
我国经济发展已步入转型期,腾飞式的经济发展推动社会发展,但过去的急功近利造成我们在生态环境方面欠账太多,引发诸多环境问题,政府针对这些问题制定了可持续化发展的解决策略,企图探寻更好的方式促使经济增长形式发生转变,从而实现经济、社会、环境协调进步。金融业作为现代经济发展的核心,其发展必然影响经济,前人已证实金融集聚可以发挥一系列效应促进经济发展,因此,实现绿色经济发展的途径之一也可能是金融聚集。分析
水体环境污染严重,有害藻华现象的频发给生态带来严重的危害,甚至危害人类生存安全。不断的探索新的更高效的抑藻材料是研究者一直以来的追求。化感物质具有可降解、环境友好型等诸多优点,而MOFs中含有金属物质,可以有效的抑制藻类生长。首次将两者结合起来用于抑藻,阿魏酸和Zn2+的共同作用将取得更好的抑藻效果。本文制备并表征了MOFs抑藻物质Zn-MOF-FA,主要研究了阿魏酸和Zn-MOF-FA对铜绿微囊
∏-凝聚环在文[Joh]和[Jon]中被称为强凝聚环。关于∏-凝聚性的最早的著名刻画是在[Ca]给出。Camillo在[Ca]中证明了下列等价:(ⅰ)R是右∏-凝聚的:(ⅱ)R是左*-环; (ⅲ)对每个n≥1,Rn的子集的右零化子是有限生成的。这种环类已被许多作者在诸如[W],[CTHW]和[CY]等文献中研究。特别地,[CY]给出∏-凝聚环更全面的刻画。本文将对∏-凝聚环作进一步研究。
培养学生的绿色环保意识和可持续发展意识是应用化学专业本科人才培养方案的基本要求之一。目前实验教学中培养学生绿色环保和可持续发展意识的实验项目较少,针对这一问题,在综合化学实验中增加本新创实验项目。实验以废弃菜籽油和甲醇为原料,氢氧化钠和氯化胆碱为催化剂,生成的副产物甘油与氯化胆碱原位形成低共熔体系,与产品形成液-液两相,促使反应正向进行,简化后处理,提高产品纯度和产率。GC-MS (Gas chr
随着深度学习理论及相关技术的发展,深度学习模型已经广泛应用于各种实际场景中。不仅图像领域中的目标检测、图像分类、人脸识别等典型的应用场景使用深度学习模型,越来越多自然语言处理的应用场景都在尝试使用深度学习模型,如情感分析、垃圾邮件分类以及机器翻译等。但是深度学习模型在面对对抗样本时表现出很严重的脆弱性,即使在原始数据中加入一点小小的改动都会影响模型的输出。近年来,研究者通过向原始数据中加入人肉眼难
DNA链置换技术推动了DNA计算研究的发展,在DNA计算机的研究中起着至关重要的作用。DNA链置换反应为开发分子计算提供了一套智能工具箱,尽管基于DNA链置换反应的逻辑门电路已经达到了很高的复杂性,但实际可实现的计算任务的扩展仍然是一个障碍。开关电路最初由Shannon于1938年提出,现在广泛应用于电信领域,是实现高速、高带宽通信的一种有效手段。本文研究开发了一种基于DNA链置换反应的DNA开关
目前,国家正积极推进区块链技术和经济社会的融合发展。然而,数字货币作为数字经济基础设施,其保护隐私的特点使其成为了犯罪分子开展非法活动的“温床”。该现象为国家促进数字经济发展,打造安全、稳定、健康的金融环境带来了挑战。因此,从海量交易数据中识别异常交易带来的安全风险,形成监管体系,推动数字经济健康发展,已成为目前数字货币监测监管的重要挑战之一。数字货币的交易账本均是公开访问的。目前,针对数字货币异
作为一种直观自然的交互方式,手势日渐从人际日常交流向新型人机交互发展,尤其是在车载控制系统上,不少高端车型已将手势识别技术应用于搭载的车载影音娱乐系统。在众多技术实现路线中,基于单目彩色摄像头的机器视觉方案因为所需的传感器简单便宜,越来越被研究者们所注意。为解决手势图片背景复杂、自遮挡、易形变等识别困难,本文利用深度学习技术提高其识别准确率。为了解决上述问题,本文设计了基于单目彩图的深度学习手势识
深度神经网络已经被广泛地应用在各个领域,但是对抗样本的存在对神经网络的应用造成了极大的安全隐患。迄今为止,许多针对深度神经网络的对抗攻击方法已经被提出来,但是这些方法依然存在很多不足之处。例如,基于梯度的攻击方法,攻击的成功率和效率都很高,但是图像修改的幅度也很大。而基于优化的或者单纯修改少量像素点的攻击方法,虽然减小了图像修改的幅度,但是由于需要进行大量的计算,攻击的效率不高,并且成功率较低。此
本研究利用苯酚—氯仿—异戊醇—核糖核酸酶法,从3个品种豇豆幼嫩叶子中分离出总基因组DNA,参照已知的几种Bowman—Birk型胰蛋白酶抑制剂基因序列和ATG起始位点,设计合成了两段长度为27bp且5端含有BamHI位点的寡核苷酸引物。以总DNA为模板,进行PCR扩增,得到长度约为340bp的均一特异性扩增产物CPTI DNA片段。 将该片段克隆到质粒载体pGEM—3zf(+)的BamHI位