面向电子病历的信息抽取技术研究

来源 :南华大学 | 被引量 : 4次 | 上传用户:sese4546
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国内医疗信息化产业的发展以及医疗数据标准体系的规范化,临床电子病历数据的研究价值也随之提高。面向临床电子病历数据的挖掘能够进一步推动智能医疗产业的发展。信息抽取技术是对电子病历文本进行知识抽取的重要手段。在临床电子病历领域,信息抽取技术的研究对个性化医疗服务、临床决策支持和随访管理等工作的开展具有重要的意义。信息抽取技术能够有效地从电子病历文本中获取医疗知识。在本文中,信息抽取技术主要是指命名实体识别技术和实体关系抽取技术。实体识别技术旨在识别出电子病历文本中多种类型的医疗实体,实体关系抽取技术旨在抽取出电子病历文本中医疗实体之间的关系。相比于其它文本,电子病历存在边界模糊、标注数据少、书写不规范等问题,以上问题加大了命名实体识别和实体关系抽取的难度,为有效地提取电子病历中的医疗实体以及实体间的关系,本文做了如下工作:电子病历中的实体识别:本文提出一种基于预训练模型EMR-BERT的电子病历实体识别的方法,利用BERT预训练模型为EMR-BERT提供基本参数,使用相关的电子病历的语料库为EMR-BERT提供预训练数据,再结合Bi-LSTM-CRF模型进行实体的抽取。最终结果与传统的模型进行对比,达到64.97%的召回率和62.14%的F值,相比传统方法在召回率和F值上分别提高了4.65%和2.16%,实验结果表明该模型能够有效地解决电子病历的实体识别的问题。电子病历中的实体关系抽取:对于关系抽取任务,选取该任务的benchmark数据集i2b2 2010电子病历数据集进行实验,本文提出一种基于注意力机制的BiGRU-CNN模型,对八种医疗实体关系的抽取结果的微平均指标进行评价,结果如下:微平均精确率、微平均召回率和微平均F1值分别为68.9%、64.6%、66.7%,实验结果表明该模型能够有效地解决电子病历的实体关系抽取问题。
其他文献
杠杆率高企是我国经济面临的突出问题,我国的宏观杠杆率在不同部门之间以及各部门内部呈现出明显的结构性特点。中央“结构性去杠杆”思路的提出,就是要求我们去杠杆的过程中
目的:探讨体素内不相干运动扩散加权成像(IVIM-DWI)在颈部淋巴结病变良恶性的鉴别诊断价值。研究方法:收集中国医科大学附属第一医院经手术或病理证实的恶性淋巴结患者和良性淋巴结患者分别为14例、12例,采用GE 3.0T磁共振仪对所有患者分别行常规MRI平扫、IVIM-DWI序列扫描;b值取值为:0,10,50,100,150,200,400,600,800,1000s/mm2共10个,由2名具
国道317线汶川至马尔康公路改建工程为“5·12”地震后阿坝州灾后重建开工的第一条二级公路,是交通部灾后重建重点项目,也是阿坝州府通往成都的重要生命线。项目里程长、
由于不可降解的合成聚合物包装造成的环境污染问题日益严重,环境友好型的可生物降解聚合物包装逐渐引起了人们的关注。其中,羧甲基纤维素(CMC)具有良好的水溶性、无毒性、无
基于一组弹性土波动方程 ,应用Fourier级数展开和Hankel积分变换 ,得到了三维问题饱和土骨架与孔隙水的应力及位移分量在变换域内的积分形式通解 .考虑地基表面透水情形 ,由
本文對明代私人藏書保護相關史料進行大量爬梳,考察明代私人藏書保護的歷史背景和基礎條件,力求從庋藏、整治、修復、抄書、翻刻等多個角度,較爲全面地還原明代私人藏書保護
目的探讨重组人脑利钠肽对高龄急性心肌梗死(AMI)合并泵衰竭患者心肌重构的影响。方法按数字列表法将2011年1月至2013年12月80例高龄AMI合并泵衰竭患者随机分为对照组和观察
目的探讨豨莶草提取液对1-甲基-4-苯基吡啶离子(MPP^+)诱导的大鼠肾上腺嗜铬细胞瘤细胞(PC12细胞)损伤的保护作用及机制。方法在生长状态良好的PC12细胞中加入终浓度为400μm