基于BERT的中文命名实体识别方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wwwzhaozhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的机器学习算法对中文实体识别准确率低、高度依赖特征设计以及领域自适应能力差的问题,提出了基于BERT的神经网络方法进行命名实体识别。首先,利用大规模未标注语料对BERT进行训练,获取文本抽象特征;然后,利用BiLSTM神经网络获取序列化文本的上下文抽象特征;最后,通过CRF进行序列解码标注,提取出相应的实体。该方法结合BERT和BiLSTM-CRF模型对中文实体进行识别,以无需添加任何特征的方式在1998上半年人民日报数据集上取得了94.86%的F1值。实验表明,该方法提升了实体识别的准确率、召回
其他文献
运用系统动力学方法,针对由两条单链多环节组成的集群式供应链,应用Vensim建模软件,建立基于竞合条件的集群式供应链跨链库存应急补充模型。通过Vensim模拟的结果,对跨链库存
<正>9月19日,由烟台西瑞康农资集团有限公司主办的"2015肥料技术创新高峰论坛暨生之道聚磷酸铵液体肥新产品发布会"在烟台召开。来自全国农技推广服务中心首席专家高祥照、中
经济的快速发展加大了对于能源的需求,在我国的石油能源中,国外进口石油所占的比重在逐年加大,为提高我国的石油开采能力,需要在开采、勘探以及测井技术等方面进行研究,提高
电信运营商业务比例的变化让能力开放成为目前各大公司重点探讨的问题。文章从平台架构出发,深入分析国内外电信运营商能力开放策略,在此基础上总结电信运营商架构中存在的问
多胺广泛参与植物的生长发育以及对各种环境胁迫的响应。综合介绍了多胺的生物合成,多胺的转运与降解过程;同时总结了植物体中多胺功能的研究方法,并对多胺研究的发展前景作
随着移动设备数量显著增加,当前的移动通信架构将很快达到极限,移动云计算应运而生。移动云计算可看作是移动通信和无线通信技术演进与融合的结果。文章首先从广域通信和短距离
社会结构与社会治理体制之间是相对应的。改革开放之前我国社会结构的突出特征是城乡二元结构,在城市实行的是单位体制,国家通过单位实现了对社会的整合。市场化改革以来,我
从兴趣和职业兴趣的内涵研究出发,分析了我国多年来面向不同群体开发职业兴趣测评工具的进展,包括职业兴趣测评工具的引进和修订,面向中学生、大学生和成年人的职业兴趣测评
【正】周:吕教授,您好!作为书籍设计师,您设计的每本书都独具匠心,印制考究,让人产生阅读和收藏的冲动;今年又传来您的《中国记忆》荣获莱比锡"世界最美的书"奖的喜讯,您能简
根据养老保险必须维持退休职工基本生活的原则,本文将养老保险替代率警戒线界定为能够维持退休职工基本生活的替代率水平下限,以扩展线性支出系统(ELES)为基础,构建了养老保险替代