基于LSTM的实体关系抽取研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:liuyi8431201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的迅速发展,互联网技术在近几年中获得了快速的发展,用户规模也呈现出了激增的态势,与此有关的互联网文本数据规模也逐年递增。在这些海量的文本数据当中,如何更为有效的寻找、提取目标信息,正成为影响互联网技术发展的迫切难题。现如今,随着人们生活水平的提高,语音识别技术、机器翻译技术、自动问答、互联网搜索等都离不开知识库,而实体关系抽取正是构建知识库的重要技术,从技术角度来讲就是从文本数据中把实体之间的语义关系提取出来。这一技术已经成为自然语言处理、机器智能学习、大数据挖掘等技术发展的关键因素,同时也意味着这一技术关系着我国未来的工业和信息化发展,具有非常广阔的应用前景。关系抽取可以称之为关系分类技术,在当前多个深度学习模型中,基于长短期记忆单元(LSTM)的循环神经网络(RNN)模型因为其能有效利用序列数据中长距离依赖信息的能力,被认为特别适合文本序列数据的处理。因此,本文提出一个基于LSTM的深度学习模型来解决关系分类问题。在基于LSTM的基础上,本文首先对词嵌入技术进行了研究,通过神经网络将词语嵌入到一个实数向量中,这个实数向量是低维度的,有效避免了传统词向量缺乏语义信息的缺点。其次,本文还对相关的数据文本特征进行了研究,提出了四种文本特征方案,将特征向量输入到双向LSTM(BLSTM)模型。之后,结合Attention机制,将不同的权重应用到相对应的时刻当中,不仅能够使模型保留有效信息,还能最大程度解决信息冗余的问题,优化文本特征向量。最后,使用梯度提升树GBDT作为分类器,在一定程度上解决了传统以Softmax用作分类器带来的模型泛化能力不强的现实困境,进一步提升关系分类的精度。此外,本文在研究的过程中还实现了实体关系结果的可视化,方便我们能够査看图数据库中的整体或局部情况,用户通过简单的操作就能查看实体之间的关联。
其他文献
企事业单位加强档案工作组织系统建设,建立职责明确的企事业单位档案工作体系,注重对分管领导和档案人员的考核,将"以人为核心"的管理理念融入到档案工作中,为档案人员实行职业
目的探讨弥散加权成像(DWI)判断强直性脊柱炎(AS)骶髂关节炎活动性的临床应用价值。方法前瞻性收集73例AS患者,根据AS病情活动指数(BASDAI)调查表、实验室检查结果将AS患者分
主要从嗜水气单胞菌感染的发现、人的嗜水气单胞菌感染、动物的嗜水气单胞菌感染、诊断要点及防控等方面对我国嗜水气单胞菌感染进行了综述。
<正> 一、前言1976年夏季,作者和武汉地质学院师生一起在迁安南区进行变质岩系的填图,同时在曹庄南山厘定了一个被后期断裂所破坏了的古老地层的不整合关系,从而划分开了早太
本篇音乐会设计,从整体构思,到具体曲目安排,包涵了不同时期作曲家创作的具有不同语言特点、不同体裁品种、不同风格特点、不同地域类别的声乐作品。结合对每首作品音乐背景
面板数据是截面个体在不同时点的重复观测数据,是同时在时间和截面上取得的二维数据.面板数据成为当代经济领域研究的热点,一方面是因为其本身优秀的特质,另一方面也归因于面板数据在应用过程中仍有许多问题和未知领域需要去探索.本文研究了部分线性固定效应面板数据模型的估计和检验问题.首先利用差分法消除固定效应的影响,然后基于B样条函数展开方法逼近模型中的未知参数分量,将模型进一步转化为参数模型,利用最小二乘方
为了提高触摸手势识别准确率,针对智能手机触摸手势工效学参数进行现场评价。首先,基于非理性用户模型提出了触摸手势现场评价因素框架;其次,设计现场评价实验,收集新手用户和经验
目的 研究骶管阻滞麻醉对因尿道下裂行尿道成形术的患儿术中和术后细胞免疫状态的影响.方法 1~5岁择期行尿道成形术患儿40例随机均分为骶管阻滞复合气管插管全身麻醉组(A组)和单
为获得准确的间谐波信号的频率分布估计值,文章提出了基于插值线性调频Z变换(chirp Z transform,CZT)的间谐波分析方法。该方法通过CZT变换获得精确的等价于离散傅里叶变换结果的