面向中文电子病历的医疗实体及关系识别技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:xjl002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息系统的加快建设,电子病历数量急剧增长。电子病历中不仅包含患者的临床信息(如检查结果、临床诊断等),还包含丰富的医疗实体,这些医疗实体大部分之间存在一定关系。使用自然语言处理技术从电子病历文本中抽取医疗实体以及实体间的语义关系,构建可用于临床决策的医疗知识库,对于推动电子病历在智慧医疗中的应用具有重要意义。目前,电子病历医疗实体识别和实体关系识别的研究主要面向英文电子病历,在中文电子病历上公开的评测及语料较少;另外,已有的研究主要基于传统机器学习方法,这些方法依赖大量人工构造的特征。综上,本文的研究内容是中文电子病历医疗实体识别及实体关系识别,主要的研究工作包括:(1)在标注规则及语料方面,制定了中文电子病历实体关系标注规则,并标注构建了实体关系语料库。在参考2010年I2B2/VA挑战评测发布的英文电子病历标注规范的基础上,并根据中文电子病历的语言和结构特点,制定了适用于中文电子病历的实体关系标注规则。在标注人员熟悉标注规则的前提下,采取传统的标注方案,以抽样检查的方式,确保标注结果真实可靠,共标注了3500份电子病历。(2)在医疗实体识别方面,提出了基于医疗知识注意力增强的实体识别方法。医疗知识词典中对于实体定义有着详细的描述,能够为电子病历实体识别提供辅助信息。因此,本文首先将CNN提取的字级向量和预训练的字级向量拼接;然后利用双向LSTM对句子编码,抽取每个字的上下文表示;接着使用注意力机制引入医疗知识词典,学习电子病历中文本和医疗知识词典中实体的共享语义;最后利用CRF来预测句子中的实体标签。在手工标注的电子病历实体语料库上实验证明,引入医疗知识词典能够有效提升实体识别的性能,F1值为92.03%。(3)在实体关系识别方面,提出了融合双向GRU和注意力的实体关系识别方法。传统的关系识别大多以句子为处理单元,忽略了语料中标注错误的句子对模型的影响,并且没有充分利用包含实体对的多个句子在分类时的相互增强作用。因此,本文首先将字向量和位置向量拼接;然后利用双向GRU学习字的上下文信息,获取更细粒度的特征;接着用字注意力机制提高对关系识别起决定作用的字符权重;最后通过句子级注意力机制获取多个句子的特征,降低错误标注对分类的影响。实验结果表明,本文方法在手工标注的语料库上取得了较好的结果,F1值为82.17%。(4)在医疗实体与实体关系联合识别方面,提出了基于多任务的医疗实体与关系识别联合识别方法。已有的联合识别方法先进行实体识别,再进行关系识别,导致实体识别的错误会传播到关系识别,忽视了两个任务间的相互支撑作用。因此,本文首先将CNN提取的字级向量跟预训练的字级向量拼接;然后利用双向LSTM抽取每个字的上下文表示;接着使用CRF来预测句子中的实体标签;最后利用图卷积网络对实体节点和关系节点联合学习,并输出节点级向量,进行关系分类。在手工标注的语料库上进行实验,实体识别和关系识别结果均优于其他模型,F1值分别为88.05%和84.81%。实验证明,我们有效的将实体识别和关系识别结合起来,充分考虑了两任务间的相互支撑作用。
其他文献
选题依据:黄芩(Scutellaria baicalensis Georgi)为唇形科多年生草本植物。根为传统药用部位,性苦味寒,临床应用悠久,主要的功效为清热解毒。而黄芩的非药用部位茎叶,作为别样
吉非替尼(gefitinib)也称易瑞沙(Iressa),是由英国阿斯利康公司研制开发的一种特异性较高的抗肿瘤靶向药物。在临床治疗非小细胞肺癌方面,吉非替尼被证明具有很好的治疗效果,
总结32例急性鼻面部复合伤患者的术后护理。护理要点为术后严密观察患者呼吸,保持呼吸道通畅;保持创面清洁,预防感染;加强疼痛护理、口腔护理及饮食护理。31例创口Ⅰ期愈合,鼻腔通
总结5例外伤性颅内出血合并凝血功能障碍患者的护理。护理重点是密切观察患者意识、瞳孔、生命体征变化,术后观察创口敷料渗血及引流液的量、颜色、性质,注意皮肤、黏膜有无
重特大安全事故往往会造成巨大的经济损失和人员伤亡,给当地社会造成一定程度的危害。同时,重特大安全事故后果的严重性与突发性也会对当地政府和企业的安全管理意识和措施造
总结13例尿毒症继发甲状旁腺功能亢进患者行甲状旁腺切除术的护理。护理重点为术前做好心理护理、安全护理及准备工作;术后严密监测血清钙、磷及甲状旁腺素水平,加强低钙血症、
多智能体系统因其高效率、高容错性、可扩展性等优势,已普遍应用于战斗机护航、多枚导弹协同突防以及智能交通信号控制等诸多方面.一致性是多智能体系统的基本问题,旨在设计
近年来,各大人力资源服务企业积极布局互联网招聘市场,使得行业的同质化竞争加剧。为了提升自身优势,企业需要为用户提供更加精准的推荐服务,这就要求在线招聘平台具有性能更