论文部分内容阅读
随着互联网时代的到来,网络中充斥着大量的文本资源,如何有效地利用计算机处理这些文本以获取有用的信息是人工智能领域的一个焦点。关系抽取作为自然语言处理的一个研究热点得到了研究者们的广泛关注。中文人物关系抽取作为一类特殊的关系抽取任务,具有重要的研究意义,其结果可用于中文人物知识图谱、中文人物关系问答等领域。目前中文人物关系抽取的相关研究主要集中在传统的关系抽取方法上,包括基于特征的方法、基于核函数的方法及基于关系模式的方法。传统的关系抽取方法存在以下不足之处:基于特征的方法需要人工定义特征且关系抽取效果直接依赖于特征选取的好坏,基于核函数的方法不适用于数据量大的关系抽取任务,基于关系模式的方法难以全面提取关系模式,进而影响了关系抽取的效果。基于深度学习的关系抽取方法弥补了传统的关系抽取方法的不足,其具有不需要人工定义特征、可适用于大数据集的关系抽取任务、抽取效果好等优点。因此,如何利用深度学习相关技术构建一个中文人物关系抽取系统是一个非常值得研究的课题。本文对深度学习技术在中文人物关系抽取中的应用进行了详细研究,主要工作如下:1)提出使用深度学习技术构建中文人物关系抽取系统,并利用远程监督方法对中文在线知识库"互动百科"和中文语料库"SogouCS 2008"进行对齐,自动构建中文人物关系抽取训练样本。2)将当前两类主要的深度学习关系抽取模型——CNN(卷积神经网络,Convolutional Neural Network)和 RNN(循环神经网络,Recurrent Neural Networks)的优点进行结合,提出了 LSTM_PCNN模型,并应用于中文人物关系抽取任务。LSTM_PCNN模型结合了 PCNN模型(CNN的衍生模型,分片卷积神经网络)能够提取局部文本特征及双向LSTM模型(RNN的衍生模型,双向长短时记忆网络)能够刻画序列数据的优点。实验证明,LSTM__PCNN模型在中文人物关系抽取任务上效果要好于双向LSTM模型及PCNN模型。3)在LSTM_PCNN模型的基础上加入注意力机制,提出LSTM_PCNN_ATTE模型,并应用于中文人物关系抽取任务。该模型在注意力机制中加入了实体对及前后文信息对句子词语权重的影响因素,利用注意力机制刻画句子中词语对于判断人物对之间关系的作用大小,使模型"注意"那些对中文人物关系抽取更为有用的词语。实验证明,加入注意力机制的LSTM_PCNN_ATTE模型比LSTM_PCNN模型在中文人物关系抽取任务上具有更好的效果。最后,实验对比了 LSTM_PCNN_ATTE模型和基于特征的方法在中文人物关系抽取任务上的效果,发现LSTM_PCNN_ATTE模型较基于特征的方法能获得显著的准确率、召回率、F值提升,从而进一步验证了深度学习方法在中文人物关系抽取任务上的有效性。