深度学习技术在中文人物关系抽取中的应用研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:wyfwin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,网络中充斥着大量的文本资源,如何有效地利用计算机处理这些文本以获取有用的信息是人工智能领域的一个焦点。关系抽取作为自然语言处理的一个研究热点得到了研究者们的广泛关注。中文人物关系抽取作为一类特殊的关系抽取任务,具有重要的研究意义,其结果可用于中文人物知识图谱、中文人物关系问答等领域。目前中文人物关系抽取的相关研究主要集中在传统的关系抽取方法上,包括基于特征的方法、基于核函数的方法及基于关系模式的方法。传统的关系抽取方法存在以下不足之处:基于特征的方法需要人工定义特征且关系抽取效果直接依赖于特征选取的好坏,基于核函数的方法不适用于数据量大的关系抽取任务,基于关系模式的方法难以全面提取关系模式,进而影响了关系抽取的效果。基于深度学习的关系抽取方法弥补了传统的关系抽取方法的不足,其具有不需要人工定义特征、可适用于大数据集的关系抽取任务、抽取效果好等优点。因此,如何利用深度学习相关技术构建一个中文人物关系抽取系统是一个非常值得研究的课题。本文对深度学习技术在中文人物关系抽取中的应用进行了详细研究,主要工作如下:1)提出使用深度学习技术构建中文人物关系抽取系统,并利用远程监督方法对中文在线知识库"互动百科"和中文语料库"SogouCS 2008"进行对齐,自动构建中文人物关系抽取训练样本。2)将当前两类主要的深度学习关系抽取模型——CNN(卷积神经网络,Convolutional Neural Network)和 RNN(循环神经网络,Recurrent Neural Networks)的优点进行结合,提出了 LSTM_PCNN模型,并应用于中文人物关系抽取任务。LSTM_PCNN模型结合了 PCNN模型(CNN的衍生模型,分片卷积神经网络)能够提取局部文本特征及双向LSTM模型(RNN的衍生模型,双向长短时记忆网络)能够刻画序列数据的优点。实验证明,LSTM__PCNN模型在中文人物关系抽取任务上效果要好于双向LSTM模型及PCNN模型。3)在LSTM_PCNN模型的基础上加入注意力机制,提出LSTM_PCNN_ATTE模型,并应用于中文人物关系抽取任务。该模型在注意力机制中加入了实体对及前后文信息对句子词语权重的影响因素,利用注意力机制刻画句子中词语对于判断人物对之间关系的作用大小,使模型"注意"那些对中文人物关系抽取更为有用的词语。实验证明,加入注意力机制的LSTM_PCNN_ATTE模型比LSTM_PCNN模型在中文人物关系抽取任务上具有更好的效果。最后,实验对比了 LSTM_PCNN_ATTE模型和基于特征的方法在中文人物关系抽取任务上的效果,发现LSTM_PCNN_ATTE模型较基于特征的方法能获得显著的准确率、召回率、F值提升,从而进一步验证了深度学习方法在中文人物关系抽取任务上的有效性。
其他文献
对Ka波段数字信道化技术体制的宽带通信卫星的通信链路进行了预算。在地球同步轨道宽带通信卫星的两个移动用户的返向链路应用场景中,针对Ka波段的雨衰问题,根据国际电联(ITU
<正>旧时四川,几乎家家户户都有荥经砂器"三大件":炖肉的砂锅、熬药的砂罐、普通人家的夜壶。荥经古城村是著名的砂器之乡,焙烧砂器时,冉冉升起的烟帘,延续着"古城烟雨"盛景
期刊
我国电子商务的快速发展源于政策红利、基础设施建设、本土市场规模和资金支持。当前,电子商务规模扩张空间有限、数字鸿沟问题突出,亟需企业进一步创新模式,为市场需求提供
集装箱正面吊的转向系统对其行驶安全至关重要,若转向系统出现故障,往往会造成重大的事故。本文以DRF400-450型卡尔玛集装箱正面吊为例,介绍全液压转向系统的工作原理及常见
《清平调词三首》为李白名作,诗其一起首二字通常作"云想",但亦存"叶想"一说。"云想"与"叶想"对诗歌内容理解差别甚大,关系到组诗构思、体裁甚至主题的判断,孰为李白诗原本,
中国国际工程承包业是我国实施“走出去”战略的重要部分。最近三十多年我国国际工程承包业发展迅速,但海外市场环境与国内市场环境差异显著。尤其是受近年来区域政治动荡,全
介绍了某电厂1 000MW超超临界机组锅炉无炉水循环泵(boiler circulating pump,BCP)工况下的蒸汽吹管经验,给出了吹管时给水流量大导致工质和热量损失大、锅炉补给水能力不足
锚定效应是普遍存在的、又难以消除的现象,存在于生产生活之中,各类工程项目实施过程中也不例外。印度BTG由于其项目特点,在设备采购过程中锚定效应相对于其他工程类型,如EPC
目的探讨中药香囊芳香气味空气消毒的效果。方法将自制的中药香囊放入消毒柜中,以含菌平皿和阳性药甲酚皂消毒液作为对照。观察中药香囊对金黄色葡萄球菌,绿脓杆菌,大肠杆菌,