基于深度学习的中文实体识别和关系抽取

来源 :武汉邮电科学研究院 | 被引量 : 2次 | 上传用户:songxuesen70
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,每个互联网的使用者都成为了内容的创作者,为了快速的从创造的海量信息中获取内容,就需要利用到信息抽取技术。信息抽取可以将非结构化的文本转化为便于存储和理解的结构化文本。中文命名实体识别和实体关系抽取是中文信息抽取技术中两个重要的基础任务。中文命名实体识别是在中文文本中识别并标注出人名、地名和组织名等命名实体的过程。实体关系抽取的目的是抽取实体对之间的关系构成实体关系三元组。实现实体识别和关系抽取一般采用两种方法,分别是基于管道模型的方法和基于联合模型的方法。本文分别使用这两种方法实现了中文实体识别和关系抽取,并对模型进行改进,提高了模型识别的性能,使模型能更好的应用于中文信息抽取中。在中文命名实体识别任务中采用了BiLattice-LSTM-ATT-CRF模型,该模型使用BiLattice-LSTM网络对输入的文本进行语义编码解决了中文实体识别中的分词错误问题,然后引入注意力机制对语义编码进行加权,最后通过CRF进行语义解码进行实体识别,在MSRA数据集上最终准确率达到95.64%,召回率达到了93.67%,F值达到了94.44%。在关系抽取任务中采用了DP-BiLSTM-SelfATT模型,该模型以依存关系作为外部语义特征,合并后的特征向量经过BiLSTM编码与自注意力加权,最终通过softmax函数进行关系预测,在人物关系数据集上预测的准确率达到78.96%,召回率达到了47.43%,F值达到了59.26%。在联合模型的信息抽取中,本文把实体和关系联合抽取的任务通过特殊的标注策略转化为序列标注任务,在BiLSTM-LSTM的端到端模型的基础上,引入了词性标注和依存关系作为外部特征,融入了注意力机制与带偏置项的目标函数,实现中文实体和关系的联合抽取。该模型在人物关系抽取数据集上预测准确率达到76.23%,召回率达到44.53%,F值达到56.22%。
其他文献
脑卒中,又称脑血管疾病,由各种脑循环障碍造成的局限性或弥漫性脑功能缺失,发病率高、死亡率高、致残率高、复发率高为特点.认知障碍为脑卒中病患最常见的表现之一.影响病患
<正> 一、一个重要而被滥加引用的方程1838年Verhulst提出的逻辑斯蒂方程,被人们广泛地引用。不仅在自然科学中,甚至在社会科学中亦如此。Deevey认为这种增长型可能是最普遍
目的:观察1 450 nm半导体激光联合自拟中药丹黄散内服治疗中重度痤疮的疗效。方法:选取2016年4月~2017年4月在我院就诊的中重度痤疮患者156例,依据治疗方式不同分为联合组、中药
老年自发性气胸多继发于肺部原有疾病,临床症状、体征不典型,病情危重,护士应提高对本病的认识,密切观察病情,协助医生早期诊断和治疗,积极预防并发症以及做好病人的心理护理是提高
随着对外开放程度的不断扩大,中国与其它国家之间的贸易往来也在不断加强。国际贸易技术溢出能够促进一国生产率和技术进步的提高已被诸多学者所证实。运用基于投入导向的规
口语是学习语言必备的技能,口语课在对外汉语教学中也是必不可少的专项语言技能课,口语课也需要讲解词汇、语法,但口语课的核心仍是组织学生进行大量的口语练习,但是,有一些教师在口语课上和综合课用一样的方法进行教学,导致多数时间是教师在说,学生在听而不是开口说话,为了进一步解决这种现象,开展了以情景教学法为指导的中级口语课堂教学的相关研究,希望可以给开展中级口语课的教师一些帮助。本文一共分为五章,绪论部分
本文采取电化学沉积方法,以尿素的甲醇溶液为反应原液,并加入少量醋酸,于单晶硅(100)获得氮化碳材料的枝状多晶体,其晶粒线径可达50μm。 X射线衍射谱分析表明,晶粒主要为立方相及少
探讨对手术前病人实施心理护理的重要性.心理因素会导致病人术前产生紧张情绪,阻碍手术的顺利实施,提倡对病人进行心理护理是提高患者手术成功的关键.为了提高手术质量,手术
随着近年来移动互联网的飞速发展,参与网购的消费者越来越多,这也给线下配送这一网购的关键环节带来了新的挑战。一方面,许多产品对物流配送的时效性均有一定要求,例如在生鲜农产品以及餐饮的配送中,产品本身易变质,因此需要准时地送到消费者手中;另一方面,随着客户量的增多,物流配送过程的优化中需要综合考虑多种因素,例如运作成本、服务质量等。如何在满足消费者良好的服务水平的同时,尽可能节约成本,成为了物流企业亟
超材料慢声器件具有非常灵活的相位控制能力,能够实现超薄的声透镜、声学整流器和声学自加速发生器等多种声学功能器件。但是,大多数慢声器件存在严重的色散、界面阻抗不匹配