【摘 要】
:
命名实体是自然语言中所提及的可识别实体,例如物体名、人物名、地点名等等,命名实体关系识别任务则是识别自然语言话语中所提及的命名实体之间的关系,它是自然语言语义识别
论文部分内容阅读
命名实体是自然语言中所提及的可识别实体,例如物体名、人物名、地点名等等,命名实体关系识别任务则是识别自然语言话语中所提及的命名实体之间的关系,它是自然语言语义识别任务的基础,占有非常重要的地位。命名实体关系识别任务的主要难点在于自然语言的千变万化,不同实体之间可能有着相同的联系,相同实体在不同句子里面可能存在着不同的关系;同时由于语言句式的纷繁复杂,如主动和被动句式;这些都为精确识别命名实体之间的关系带来了许多困难。以往的研究当中,在送入系统之前,往往需要对输入句子做一些基于外部语义的预处理,例如提取依存分析树得到实体之间的依存路径,或者依赖词性识别技术对句子中每个词语做词性标注等等。预处理的效果好坏往往在根本上决定了这类方法的性能,如果预处理不当可能会给任务增加大量噪声,使得系统不稳定。本文使用基于多重自匹配注意力机制的模型,将注意力集中在有用的信息上,识别出句子当中对命名实体关系识别任务起重要作用的词语并对其进行增强,削弱无关的干扰词语,同时极大的缩减了学习参数的数量,降低机器学习的难度以及过拟合的可能性。实验表明,本文方法在SemEval2010task8任务中,Macro-F1指标达到了 85.34。本文主要研究内容包括:(1)研究并实现基于依赖传统外部语义方法,分析方法的优劣并将其实验结果作为与本文提出方法所比较的baseline。(2)研究并实现基于语法分析树的神经网络方法,分析方法的优劣并将其实验结果作为与本文提出方法所比较的baseline。(3)研究并实现已有的不依赖传统外部语义的方法,分析方法的优劣并将其实验结果作为与本文提出方法所比较的baseline。(4)提出新的基于多重注意力机制的深度神经网络关系识别模型。
其他文献
目的:本课题重点研究原发性肝癌患者在单纯行肝切除术的的基础上,分别给予不同的多途径血供阻断治疗方法,观察原发性肝癌患者在手术切除联合多途径血供阻断治疗后的生存情况,
本论文首先开展真人的异步协作创新设计实验,实验参与者可自由选择“原创”或“引用”的方式完成设计,基于真人实验建立了设计师行为模型,开发仿真实验平台并在该平台上展开
随着低功耗无线通信技术之发展,无线传感器网络(Wireless Sensor Networks,WSNs)技术随之兴起,并得到广泛关注。目前,WSNs中信号处理面临的主要挑战有信道估计、节点时钟同步
资料显示,客户满意度的提升与企业价值的实现呈现出较强的关联性。美国《财富》杂志曾经对“全球500强企业”进行过一次详细的跟踪调查,调查表明,客户的满意度指数与“经济增
人力资源是企业发展的首要资源,是企业竞争优势的核心所在。绩效考核是人力资源开发与管理中的重点和难点。没有科学、合理的绩效考核制度,企业的发展战略就无法落实到具体的
我国以燃煤为主的能源结构需要一定规模的水力发电容量来负责电网的负荷调节,而传统水电站受季节性径流影响,需要大量弃水才能参与电网的削峰填谷。双馈水轮发电机组作为一种
《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》(本文简称:“《解释》”)第4条以及《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释(
在输电线路运行中,格构式输电塔架在荷载作用下产生位移,位移过大会使导线偏离设计位置,导致安全隐患,甚至造成严重的事故。本文基于基础板基底反力为非线性分布、并考虑塔架
弥散型核燃料作为事故容错燃料中最重要的一种类型,是把含有裂变物质的燃料相颗粒均匀地弥散分布在性能优良的非裂变基体相中而得到的燃料。尤其是以钼为弥散介质的的弥散型
随着游戏行业的不断发展,人们对计算机游戏中虚拟人物的行为的要求越来越高。在虚拟骑行系统中,由于单人训练模式的虚拟骑手骑行行为过于单一化,让训练者感到枯燥乏味而对骑