【摘 要】
:
命名实体识别和关系抽取是知识抽取的重要环节,也是建立知识图谱的关键技术。目前研究方法主要有两种,一是使用流水线的方法,先做实体识别任务,再完成关系抽取。但是前者的错误会影响到下面的任务性能,也会产生很多没有关系的实体对这种冗余信息。二是同时从非结构化的文本中抽取实体和它们之间的关系,称之为联合抽取,可以弥补前者的不足。但是该方法目前大多数也是基于特征的结构化系统,需要做一些复杂的特征工程工作,这也
论文部分内容阅读
命名实体识别和关系抽取是知识抽取的重要环节,也是建立知识图谱的关键技术。目前研究方法主要有两种,一是使用流水线的方法,先做实体识别任务,再完成关系抽取。但是前者的错误会影响到下面的任务性能,也会产生很多没有关系的实体对这种冗余信息。二是同时从非结构化的文本中抽取实体和它们之间的关系,称之为联合抽取,可以弥补前者的不足。但是该方法目前大多数也是基于特征的结构化系统,需要做一些复杂的特征工程工作,这也可能会导致错误传播。本文重点围绕实体识别和关系联合抽取进行了深入研究,具体内容如下:(1)将命名实体识别和关系抽取任务转化为序列标注任务,提出了一种新的基于特殊标注策略的端到端联合抽取模型。该模型运用了Google开源的BERT模型训练分布式的词向量作为标签语义表示的初始化方式,来表示输入文本。然后以双向LSTM层进行编码,以融合了注意力机制的LSTM层进行解码。最后通过softmax函数输出抽取预测标签结果。另外,该模型使用一个带有偏置项的目标函数来对模型进行优化,使模型能够精准地进行预测。在NYT公开数据集上,该模型取得了比较好的性能。(2)将知识图谱技术手段应用到关联交易公告中,尝试针对这一领域建立一个轻量级的知识图谱,有助于企业关联分析交易。关联交易类公告作为上市公司信息披露的其中一类重要的公告类型,具有很强的研究价值。本文对构建关联交易知识图谱中的本体构建、知识抽取、知识存储、可视化分析等过程进行了说明。综上所述,本文的创新点在于针对实体识别和关系抽取任务,提出了一种新的基于标注策略的端到端的联合抽取模型。在Bi LSTM-LSTM-Bias模型的基础上使用BERT模型训练分布式的词向量,同时引入了注意力机制,获得了更多的上下文语义信息,并通过实验证明了其有效性。
其他文献
在网络科技发展日新月异的今天,自拍照编辑已经成为人们在网络上积极自我呈现的重要形式,本研究聚焦于外貌比较和社交内容比较对自拍照编辑的影响,选取有自拍照编辑经历的女大学生作为被试,采用问卷法和实验研究的方式,通过三个研究探究外貌比较和社交内容比较对自拍照编辑的影响机制。研究一采用问卷法测量,旨在探究外貌比较、社交内容比较与自拍照编辑之间的相关关系,研究结果显示,研究结果显示,外貌比较和社交内容比较均
具身认知作为第二代认知科学已经成为当前认知心理学的主流发展方向,在批判传统认知的基础上提出身、心、境是一个统一的整体。具身认知的提出重新界定了认知、身体与世界的关系,为教育教学领域的变革与创新带来了全新的研究视角。因此,如何借助具身认知理念,结合数学学科的本质和数学学习的特点,给小学阶段数学教学注入新活力,实现培养学生数学核心素养的目标,是一个值得深入探讨的问题。本论文围绕具身认知视域下如何提升小
小学语文与儿童文学具有千丝万缕的联系,儿童文学教学能够促进小学生语文学习,使其从中体会文化之美、语言之美、情感之美,而且能够促进情感表达和审美体验,这是儿童文学与小学语文的文化担当和共同愿景。目前,随着小学语文教育改革的进行,儿童文学在小学语文中的教学与应用引起了广泛关注,同时,小学语文教师在促进儿童文学与小学语文的联系中发挥重要角色,因此,小学语文教师的儿童文学素养就成为了重要话题。本文将采用文
无论是在传统山水画还是在当代的山水画中,装饰性一直存在的,例如在图式、笔墨、色彩上都有着异于传统山水画的面貌,在山水画中呈现装饰意味,这在山水画创作的过程中是很重要的,这可以给我们在山水画创作的过程提供更多的方向和参考,而在当代山水画的发展上,我们要结合山水画的精神融合一些现代化的表达方式,让主观意识在绘画创作中去体现更多的艺术表现形式,这种主观意识在深刻的表达主观创造者的丰富的内心情感的同时,使
近年来在上市公司中被曝出多起审计失败的案件,审计失败不仅使相关会计师事务所站在了投资者们讨论的风口浪尖,而且还会使会计师事务所面临证监会处罚、投资者索赔,也会损失自身的声誉,更会有损审计行业形象。经济的发展使企业的业务越来越多元化,开展经营活动的方式也在不断增加,对于会计师事务所开展的审计工作也提出了挑战。对于审计失败,许多学者都提出了多方面的看法建议。但如今,会计师事务所也面临压力,有随着科技发
“绿色”、“创新”是党的“十九大”提出的新发展理念的重要组成部分。中国经济已经从高速增长阶段进入了高质量发展阶段,绿色发展、创新发展已经成为国家发展战略。企业不仅是环境保护的主体,还是技术创新的主体。实施“绿色”发展和“创新”发展战略,客观上要求企业提高环保力度,加大研发强度。但在企业层面,环保力度、研发强度和公司绩效能否实现内在的统一?在学术界,还没有形成一致的意见。本文以2010-2017年上
Marcinkiewicz积分是奇异积分算子理论中的重要算子,它也是在微分方程应用中产生的一类重要算子。当代许多学者对Marcinkiewicz算子在不同函数空间下的性质进行了深入研究。本文主要讨论带奇核的Marcinkiewicz积分算子的变差不等式和带非光滑核的Marcinkiewicz积分算子的范数不等式。具体来讲,本文主要分为以下三个部分:第一章,主要介绍了相关背景知识、国内外的研究现状和
数的运算在小学数学的教学过程中起着非常重要的作用,是学生后续学习发展的重要基础,同时也是小学阶段学习的重要内容,并对其他领域内容的学习产生重要的影响。《标准(2011版)》中对于数的运算内容分为两个学段,分别设置了不同的课程内容。小学低年级的主要内容就是结合具体情境,体会四则运算的意义,进行简单的计算并能解决生活中的简单问题。在掌握基础知识与技能的基础上还要培养学生的运算能力,这都离不开计算教学。
中国的鞋履有着悠久的历史和文脉,最早可追溯至旧石器时代,那个时候人们用兽皮作为材料来保护脚部,后来随着文明的不断发展,鞋靴的样式、材料和工艺也不断进步。但是在工业革命后,由于我国近代工厂化制鞋起步较晚,累积经验不足,呈现出典型的“重制造,轻设计”特点,导致自身特色不突出,品牌定位尴尬的局面。随着网络化,国际化的不断发展,中国的品牌也正融入国际潮流,如李宁在2018纽约时装周上的精彩亮相,具有中国元
AP2/EREBP转录因子是植物最大的转录因子家族之一。前期研究表明,AP2/EREBP转录因子在植物体胚发生过程中具有一定的反馈调节作用,可以为突破优质作物育种瓶颈提供新的契机,然而AP2/EREBP转录因子家族在荔枝作物离体再生中的作用还未见报道。本研究对来源于荔枝基因组的AP2/EREBP基因家族进行了分析,研究了若干AP2/EREBP基因在荔枝体胚发生过程中的表达。主要结果如下:1、从荔枝