融合知识的中文医疗实体识别模型

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:qingfeng112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 从医疗文本中抽取知识对构建医疗辅助诊断系统等应用具有重要意义。实体识别是其中的核心步骤。现有的实体识别模型大都是基于标注数据的深度学习模型,非常依赖高质量大规模的标注数据。为了充分利用已有的医疗领域词典和预训练语言模型,本文提出了融合知识的中文医疗实体识别模型。一方面基于领域词典提取领域知识,另一方面,引入预训练语言模型BERT作为通用知识,然后将领域知识和通用知识融入到模型中。此外,本文引入了卷积神经网络来提高模型的上下文建模能力。本文在多个数据集上进行实验,实验结果表明,将知识融合到模型中能够有效提高中文医疗实体识别的效果。
  关键词: 实体识别; 序列标注模型; 融合知识
  文章编号: 2095-2163(2021)03-0094-04 中图分类号:TP391.4 文献标志码:A
  【Abstract】Extracting knowledge from medical texts is of great significance to the construction of medical auxiliary diagnosis system and other applications. Entity recognition is an important step. Most of the existing entity recognition models are based on the deep learning model of annotation data, which rely heavily on high-quality large-scale annotation data. In order to make full use of the existing medical dictionary and pre-training language model, this paper proposes a Chinese medical entity recognition model with knowledge fusion. On one hand, domain knowledge is extracted based on domain dictionary; on the other hand, the pre-training language model BERT is used as general knowledge, and then domain knowledge and general knowledge are integrated into the model. In addition, convolution neural network is introduced to improve the context modeling ability of the model. In this paper, experiments are carried out on multiple datasets. The experimental results show that knowledge fusion can effectively improve the effect of medical entity recognition.
  【Key words】 entity recognition;
其他文献
对轮缘间隙出流与主流相互作用下的动叶端壁气膜冷却特性进行了研究,通过数值求解三维RANS方程组和SST湍流模型,详细分析了冷却气流质量流量比MR和进气预旋度等气动参数对动
为探究格尼襟翼对垂直轴风力机气动性能的影响,结合TSST湍流模型对直线翼垂直轴风力机展开数值模拟研究.结果表明:低尖速比下,格尼襟翼可显著提升垂直轴风力机的气动性能,但
为了能在早期发现压气机叶片积垢、叶片磨损腐蚀、进气口结冰和喘振4种常见故障,提出一种基于长短期记忆网络(LSTM)和支持向量机(SVM)的燃气轮机压气机故障预警方法.首先,利
基于射流的主动流动控制方法,在透平叶栅端壁前缘位置开设射流孔.通过数值模拟分析了射流孔位置、倾斜角、俯仰角和动量系数等因素对前缘马蹄涡以及流动损失的影响.结果表明:
针对某300 kW功率等级的超临界二氧化碳简单回热发电系统建立了全系统动态仿真模型,研究了系统发生紧急停车时的动态响应过程及阀门流量特性对过程控制品质的影响.结果表明:
为了提高快速帧移动多视点图像的检测跟踪识别能力,提出基于Harris角点检测的快速帧移动多视点图像跟踪识别方法。构建快速帧移动多视点图像检测和帧稳定性控制模型,采用数字特征融合技术,实现对快速帧移动多视点图像的模糊度增强和融合处理,通过多维空间参数检测技术,实现快速帧移动多视点图像的动态参数识别,结合联合滤波特征匹配方法,采用稳像控制技术,建立快速帧移动多视点图像的灰度参数分析模型,根据Harri
摘 要:为提高非平稳性电力负荷的预测精度以及充分挖掘历史负荷数据的时序特征,本文提出了基于注意力(Attention)机制和经验模态分解(EMD)以及门控循环神经网络(GRU)组合的负荷预测方法。首先使用EMD对原始负荷数据进行EMD分解,继而得到有限个具有本征模态函数(IMF)的分量;然后考虑到各分量间的相关性,使用多层GRU网络对IMF分量进行多输入多输出预测,同时引入注意力机制,深入挖掘历史
摘要:弗兰克-赫兹实验是“近代物理实验”中的重要实验之一,数据量大且数据处理复杂。支持向量机是一种广泛应用于函数逼近、模式识别、回归等领域的机器学习算法。本文将支持向量机算法应用于弗兰克-赫兹实验数据的拟合,过程简单,在python环境下验证该方法拟合精度高,效果好。支持向量机算法还可应用于其他的物理实验曲线拟合。  关键词:支持向量机;曲线拟合;弗兰克-赫兹实验;Python  中图分类号:TP
摘要:随着人们自驾出游的频率逐步提高,城市交通拥挤堵塞的情况时常出现,给应急指挥车的救援带来诸多不便,为使应急指挥车能够机动灵活地深入城市各个角落,及时有效解决各类突发事故,通过ArcMap以城市交通道路为源构建了网络数据集,将城市交通道路网抽象为图的结构,使用邻接表以及二叉排序树结构对传统Dijkstra算法进行了改进,并基于改进后的Dijkstra算法,采用ArcGIS Engine、Visu
针对肌肉电信号(EMG)控制假手的需求,介绍了一种仿生机械手的设计和控制仿真.此机械手优势在于关节和手指尺寸完全还原真实人手的大小.首先,在多自由度的基础上,建立了五指的