英文事件抽取关键问题研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:adder2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取是以事件为单位进行信息抽取的起点,具有较高的理论与应用价值。目前相关研究首先过度注重语句,而忽视了文档级别信息;其次面对多类型事件句,难以有效识别事件类型;最后注重事件识别与论元识别的管道模型,从而导致了错误传播。针对上述问题,本文主要研究内容包括以下三个方面:首先,本文提出一种借助注意力机制将局部的字符、词、实体与全局的文档中事件的共现等信息统一建模的序列到序列事件识别方法。在LDC2017E02语料上实验结果表明,该方法能有效提高事件识别性能。其次,面对多类型事件识别困难问题,本文提出了一种融合ELMo的图卷积网络事件识别方法。该方法能借助依存分析建立事件之间的联系,并利用图卷积网络对依存分析结果进行学习。实验结果表明,该方法能进一步提升事件识别的性能。最后,由于语料规模问题,本文提出了一种融合局部特征与图卷积的事件抽取联合模型。该方法通过图卷积网络学习事件间的联系,及通过记忆单元学习事件论元与事件类型间的语义联系。在TAC KBP 2016测试集上的实验结果表明,该联合抽取模型能有效提高事件识别与论元识别的性能。
其他文献
随着区块链以及加密数字货币的不断流行,基于非对称加密的公私钥被区块链系统广泛使用。作为控制资产的唯一凭证,私钥由用户个人保管,避免了系统侵犯用户资产的可能。但同时
浮游生物是水域生产力的基础,是鱼、虾、蟹的优质饵料,其群落类结构特征以及生物多样性指数能侧面反映水体理化情况。呼伦湖是中国蓄水量第三的淡水湖、东北第一大湖、内蒙古
寨上金矿床地处岷-礼成矿带,是西秦岭地区近年来发现的一个较为重要的金矿床。矿体位于国营-牛场背斜当中,分为南北矿带,北矿带位于背斜北翼下二叠统当中,南矿带位于背斜核部
现代化、城市化浪潮催生了当代的怀旧风潮,各地政府部门积极挖掘地方民俗文化资源,打造民俗节事怀旧空间,满足人们的怀旧消费需求。目前,学界对民俗节事怀旧空间的关注较少,
蛋白质与蛋白质间之间的相互作用是细胞各项生命活动正常运作的基础,是细胞各项功能实现的重要途径。本研究利用酵母双杂交为技术,以14-3-3epsilon为诱饵蛋白,筛选出人胎脑cD
随着高端精密装备制造业的发展,对高端精密装备的精度水平要求越来越高,对校准高端精密装备的测量仪器的精度提出了更高的要求。坐标测量机作为现代化自动测量复杂形状零件的
细胞是生物体基本的结构和功能单位。生命科学各个领域都关注对细胞大小分布与形体特征的研究。在医学上很多疾病的发病机制、诊断、治疗的反馈都需要识别细胞的形态特征。特别是在疾病的早期,细胞形态和内部结构会发生变化,但是细胞代谢物暂未发生明显改变,各种生理化学指标正常。因而从细胞的物理特征的变化作出早期诊断,是一个特别吸引人且值得探索的领域。光在细胞中传输,散射光中携带有细胞结构和形态的信息,应用光散射方
图片描述翻译任务是通过机器翻译系统,将图片源语言端描述翻译为目标语言。图片描述都是以短文本为主,无法为翻译系统提供足够的上下文信息。因此,如何将图片信息更好的融入
产业资本和企业的生产经营联系较为紧密,相比于一般投资者有明显的信息优势,他们对于市场的认识、对于宏观经济形势的预期判断往往比一般投资者要更深入和超前,所以研究产业
高端制造装备的快速发展对机床和坐标测量机的标定技术要求越来越高。激光追踪测量技术作为高端制造装备的核心技术之一,成为目前亟待解决的关键技术问题,因此对作为校准仪器