基于GRU-CRF的中文命名实体识别方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:zjr_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文命名实体识别作为中文自然语言处理领域中的基本任务之一,是中文自然语言处理综合应用中机器翻译、信息抽取等任务的基础环节,直接影响自然语言处理后续工作的性能。随着网络文本资源的增长,从网络中高效地发现和获取新知识,通过文本更方便地进行知识挖掘和分析,中文命名实体识别发挥着重大作用。研究实现基于深度学习的中文命名实体特征提取算法来更好地识别中文命名实体的实体特征,提高系统对中文命名实体特征的识别能力,是基于深度学习的命名实体识别问题研究的重要内容。论文以基于深度学习的命名实体识别为主要研究内容。首先,对国内外命名实体识别的解决方法进行了研究,而后,针对近几年基于深度学习的相关神经网络解决命名实体识别的方法进行分析,深入研究了基于循环神经网络、长短时记忆神经网络、门控循环单元网络等模型的中文命名实体特征提取算法。最终提出了解决中文命名实体识别问题的新方案。针对中文命名实体识别提出一种门控循环单元网络(GRU)和条件随机场(CRF)相结合的神经网络模型。对该模型在中文命名实体识别任务的应用进行深入研究,优化了模型训练过程对于中文命名实体特征提取的效果,解决了实验中中文标注语料匮乏的问题,使其能够在少量人工标注的前提下,有效地处理大量中文语料,并能在短时间内实现对语料庞大的中文数据进行中文命名实体的有效识别。最后,对基于GRU和CRF的神经网络模型进行实验对比分析,实验结果表明,该神经网络标注模型在中文命名实体识别任务中具有良好的中文命名实体识别效果,尤其是在人名和机构名方面的识别效果优于其他神经网络模型。
其他文献
<正>本文提出了一种普遍方法合成介孔有机硅纳米粒子。粒子的大小,形貌和孔道的对称性都可以可控的调节。通过调节适当的试验参数,可以获得立方(Pm3n),二维六方(p6mm)和蠕虫
会议
梅村的诗歌 ,创作颇丰 ,后世誉为“一代诗史”;而对其剧作 ,则被视为“案头之曲”,研讨者寥寥。笔者认为 :他的杂剧同样具有独特的思想内容和艺术成就 ,其贡献亦功不可抹。本
目的研究精细化护理模式对剖宫产产妇护理满意度及早期泌乳的影响。方法将2015年1月至2017年12月在我院行剖宫产手术的200例产妇随机分为对照组和观察组,各100例。对照组产妇
现代社会的步伐的加快和扩展的复杂化,使人的生存状态变得越来越脆弱与不稳定,主体也处于不断地分裂、破碎、消散的状态。本文从媒介文化的背景出发,以“80后”集体怀旧为研究对
<正>在48万多平方公里的巴音郭楞州大地上,从微波荡漾的博斯腾湖,到野骆驼怡然游走的罗布泊,再到机声隆隆的塔里木盆地……优美的生态环境是确保巴音郭楞州人民安居乐业的基
2017年年底,深圳市政府印发《深圳市"城中村"综合治理行动计划(2018—2020年)》,要求自2018年起,全面实施"城中村社区治安治理、消防安全治理、用电安全治理、燃气安全治理、
Geobacteraceae铁还原微生物在各种污染环境中普遍存在,但目前还未出现关于PAHs胁迫下水稻土相关的Geobacteraceae铁还原微生物的报道。本文采用PCR-DGGE技术研究了水稻根际
以大豆蛋白粉为原料,利用碱性蛋白酶水解制备寡肽。研究了不同水解度(DH)的大豆蛋白酶解物抗氧化活性及氨基酸组成。结果表明:在酶解物浓度为2 mg/m L时,水解度为14.05%、15.
采用Q方法,通过收集并分析受访者对不同类型旅游目的地形象的偏好排序,发现其形象间存在兼容性和不相容性,且存在5种典型旅游目的地形象偏好结构,分别是:自然生态旅游偏好型
目的通过分析我院手术病例,探究手术室护理管理与医院感染水平之间的关系。方法选取我院2017年1月-2017年12月手术室接受患者150例为研究对象,通过随机数字表法将患者分为观