基于双向上下文的集成实体链接技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:magy_java2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的快速发展伴随了非结构化文档数据的急剧增长,但是自然语言的歧义性和多样性增加了文本的处理难度。实体链接技术将文档中的实体指称链接到知识库中无歧义的实体中,可为信息的后续处理提供重要支持。不同于传统的实体链接技术忽略了同篇文章中所有实体之间的关联性,集成实体链接技术虽然使用此类信息提高了算法精度,但在实际使用中仍存在以下问题:一是算法要尽可能平衡精度和计算复杂度;二是模型泛化能力要強,才能适用于拥有多个领域数据的实际场景中。
  针对这些问题,本文对集成的实体链接模型进行了深入的研究,设计了一个基于双向上下文的集成实体链接模型(BCEL,Bidirectional Context-based Collective Entity Linking).对于文档中某一实体指称,模型收集了它在文档中位置之前的实体集与位置之后的实体集组成双向上下文信息,并通过三种结合方式来学习实体之间的关系以确定它的链接对象。相比基于图的集成模型(运行时间随实体数目指数增长),BCEL拥有耗时随实体数目线性增长的优势;相比基于单向积累实体间上下文信息的模型,BCEL拥有同篇文章中所有实体的信息量,模型的泛化能力更强。
  模型在公开数据集AIDACoNLL-YAGO上训练并测试,结果表明,模型在同领域的AIDA-B测试集上精度达95.11%,提升了0.47%;模型的时间消耗随链接实体指称数目的増加呈现线性增长的特性,有利于链接长文本中的信息;此外,模型在5个跨域数据集上的性能虽然低于基于图的模型,但是优于基于单向上下文的集成模型。总体上看,BCEL模型较好地平衡了精度和时间成本,提升了泛化能力,在实际使用中有较好的应用场景。
其他文献
【摘要】在电力系统中,35kV变电站占据着至关重要的位置,是其重要的组成部分,同时,二次设备在35kV变电站中也有着非常重要的位置,其发挥着重要的作用和功能,对整个的变电系统的相关性能是非常重要的,主要包括其安全性和稳定性,所以,重视二次设备的检修维护及管理是非常必要的。在该文中,提出了35kV变电站二次设备检修维护措施和手段,分析了二次设备检修维护的内容,并且阐述了对其的管理。  【关键词】35
期刊
【摘要】文章针对水电站建设中的引水隧洞施工工程,对其施工勘察的重点内容进行介绍,分析引水隧洞施工技术应用中的重点和要点,并对其中的竖井施工中的注意事项和要求进行研究,以供参考。  【关键词】水电站建设;引水隧洞;施工技术  1、引言  近年来由于环境恶化和资源紧缺问题的不断加快,我国也加快了对水电站的建设速度,水电站的建设数据量在不断增多且建设规模也在不断扩大,使得水力发电在目前电网中地位不断提高
期刊
【摘要】受益于经济迅速增长的影响,我国的水电站建设事业获得了发展。对于水电建设资源的供应链而言,涵盖了供应商与分包商、工程承包方、物流方等诸多组织,其中施工阶段的主要物资与机电设备供应链风险管理可谓重中之重。本文通过阐述水电站建设期主要工程物资与机电设备供应链管理中的风险,进而从施工现场的主要工程物资、机电设备两个方面,提出了供应链风险的管控对策。此研究以分析水电站建设期主要工程物资与机电设备供应
期刊
伴随着移动互联网应用的高速发展,移动群智感知作为一种新型的数据采集和处理范式应运而生。移动群智感知利用分布广泛的移动设备用户进行数据的采集和处理工作,在诸多领域发挥了重要作用。然而移动群智感知系统依赖于大量移动设备用户的参与,为了更好地吸引移动设备用户,隐私保护与激励机制是移动群智感知急需解决的问题。
  目前已经有许多隐私保护和激励机制的研究成果问世,但是很难将某项隐私保护的成果与某项激励机制的成果直接结合,而不影响其效果。有许多研究工作将隐私保护与激励机制结合起来考虑,设计了许多能够对用户隐私提
超可靠低时延通信(Ultra-Reliable and Low Latency Communication, URLLC)被认为是工业自动化、智能交通及远程医疗等众多新兴领域的技术基础,也是本文重点讨论的内容。本文主要分析了移动场景下URLLC的几何拓扑结构和性能,并使用分集重传策略提高成功率。以下行链路为例,考虑如何满足URLLC的服务质量(Quality of Service,QoS)要求,其中端到端延迟主要包含传输延迟和排队延迟,可靠性指标主要包含传输错误率和排队时延违反率。极低延迟下信道编码的码长
【摘要】水利水电工程施工质量是保障水利水电工程有效性的根本因素,如果质量无法达到相关的标准要求,那么整个工程就没有了价值。管理水平的高低是决定工程质量是否合格的关键点,所以必须要对质量管理重视起来。基于此,文章首先就水利水电工程的特点以及影响施工质量的因素进行了分析,而后探讨了水利水电工程施工质量管理中存在的问题,最后提出了行之有效的解决措施,希望通过文章的分析,能够促进工程的质量管理工作,进而使
期刊
【摘要】文章以水利水电工程的水库溢洪道设计为研究对象,首先以某工程为例对其工程概况进行了分析,随后对选择溢洪道孔口尺寸进行了研究分析,最后针对泄槽水面线进行了研究分析以供参考。  【关键词】水利工程;水库;溢洪道设计  前言:  某水库位于赣江支流,其以供水、灌溉为主,发电、防洪为辅,水库大坝为土石坝,在右岸坝端设有开挖式溢洪道,该溢洪道由由进水渠、控制段、陡槽段及消能段组成,其中进水渠底部宽度2
期刊
【摘要】我国水利水电工程建设的质量要求随着科学技术水平的提升而提高,因此,对水利水电工程进行施工技术的创新和完善是必然的,对灌浆技术的运用是相当重要的施工方式,需要不断对关键技术进行研究,并不断完善,促进水利水电工程质量逐渐提升。  【关键词】水利水电工程;大坝施工;灌浆技术  前言:  随着我国经济的发展与进步,在水利水电工程施工的过程中,科学合理的应用灌浆技术能够有效的提高水库大坝的坝基稳定性
期刊
自动文本摘要技术旨在从文本中提取重要信息来自动生成摘要,它能够对文本的信息进行有效压缩与提炼。这在信息急剧增长的互联网时代,可以有效地解决信息过载问题,从而极大地提高人们浏览和处理信息的效率。本文在对生成式摘要方法进行研究时发现,现有模型主要采用编码-解码的方式生成摘要,而这种方式缺少了对文本信息的选择过程,导致有大量与摘要无关的冗余信息对生成摘要造成干扰。因此,本文认为目前的主要挑战在于从原文本中有效地选择出重要信息,并忽略掉非关键信息。
  针对上述挑战,本文基于选择性编码模型(Selectiv
【摘要】水利水电工程施工技术直接关系到整个工程的施工质量和进度。文章首先总结了水利水电工程的施工技术和管理,然后分析了水利水电工程有效管理的相关措施。最后阐述了水利水电工程施工技术管理的重点,并简述了相关工程的建设,有一定的借鉴意义。  【关键词】水利水电工程;施工技术;质量;管理;探析  在水利工程建设中,如何利用先进的水利水电工程施工技术,对提高施工效率,加强施工质量,降低施工成本起着重要作用
期刊