【摘 要】
:
电子病历是一种以文本格式存储患者病史的数字版本,它以一种全新的方式塑造了我们的医疗领域,我们可以将所有信息收集到一个地方,供医疗服务者使用。从电子病历中自动提取这
论文部分内容阅读
电子病历是一种以文本格式存储患者病史的数字版本,它以一种全新的方式塑造了我们的医疗领域,我们可以将所有信息收集到一个地方,供医疗服务者使用。从电子病历中自动提取这些信息就要自动识别与患者健康紧密关联的命名实体及实体之间的关系。近年来,将自然语言处理和信息抽取等技术应用在电子病历文本上并服务于支持临床决策的研究得到广泛关注。命名实体是一个单词或短语,它清楚地从一组具有类似属性的其他个体中标识一个个体。命名实体的例子包括机构名称、人员名称和位置名称等;生物医学领域的例子有蛋白质、基因、疾病名称和药物名称。命名实体识别是识别文本中的命名实体的位置和类别的过程。从电子病历中识别医学实体而采用现有的模型已被证明是一项具有挑战性的任务,因为大多数电子病历都是匆忙编写的,并且与预处理不兼容。此外,不完整的语法、众多的缩写、数值后的单位使得识别任务更加复杂。标准自然语言处理工具在电子病历上应用时不能有效地执行,因为标准自然语言处理的实体术语不是为医学领域设计的。因此,有必要研究一种有效的电子病历实体识别方法。本文研究的内容是利用深度学习算法完成中文电子病历的命名实体识别,并利用迁移学习算法解决训练数据不足的问题。深度学习算法选取BILSTM与IDCNN两个目前应用较多且表现较好的模型。迁移学习则通过谷歌提出的预训练模型BERT实现,将BERT与下游的BILSTM(或IDCNN)+CRF模型组合,加载预训练的BERT模型参数在实验数据上进行fine-tuning以完成训练数据较小的中文电子病历命名实体识别任务。在实验中,我们对比了BILSTM-CRF与IDCNN-CRF模型组合的性能,并对比了使用预训练模型BERT与ALBERT前后的实验结果。评价指标选择precision、recall和F-score。实验结果表明BILSTM的表现优于IDCNN,使用预训练模型对实验结果有较明显的提升,预训练模型ALBERT表现优于BERT。实验得到表现最好的模型组合为ALBERT-BILSTM-CRF。
其他文献
【目的】通过回顾性分析社区获得性肺炎(CAP)合并糖尿病患者及CAP不合并糖尿病患者的住院临床资料,探讨CAP合并糖尿病患者的临床特点,同时为罹患CAP的糖尿病患者的治疗及预后
本文研究一类浮游生物模型,主要运用非线性分析和偏微分方程相关知识,特别是椭圆方程不动点指数理论以及特征值理论,研究了共存解的存在性和其平半平凡解的稳定性.本文首先研
内波是发生在稳定层化流体中的一种波动.由于温度和盐度的变化,海水的密度分层是海洋的重要特征.而海面压力场变化、海底不平地形、潮汐作用以及海底地震等各种扰动激发的内
重置控制系统是一种具有能在瞬间时刻重置原系统的状态功能的线性补偿器,一般情况下它可以在预先设置的重置条件被满足达到重置时刻时将系统的状态重新调整为零,对于一些不稳
海事管理体制的法治化,是行政法治化建设的一部分,其有助于行政权力的规范化运行,有助于行政目标的实现,有助于国家的现代化建设。海事管理体制的法治化建设是推进海事治理体系和治理能力现代化的重要内容,是规范和保障海事行政权高效运行的内在要求。实现海事管理体制的法治化,才能适应国家全面深化改革和全面依法治国的战略要求,才能适应国家交通强国和海洋强国建设目标的要求,才能更好的服务国家海洋事业的发展和经济社会
西北内陆地区降雨稀少,蒸发作用强烈,河流—地下水转化频繁,潜流带作为河流与地下水之间相互作用的重要纽带,具有独特的水文调节、环境缓冲和生态保护等重要功能。潜流带内水量交换时空变化研究为玛纳斯河流域河流—地下水系统生态健康的科学管理与可持续发展提供数据支撑,同时其内在的水动力场和温度场由于驱动着河水与地下水混合作用以及能量的迁移转化等,成为深入开展潜流带水文地球化学研究的基础。本文选取玛纳斯河溢出带
研究目的:本研究旨在检测BCR-ABL(-)骨髓增殖性肿瘤(MPN)患者的IL-9和IL-6的表达水平及外周血Th9细胞比例,并探究IL-9表达与JAK2基因突变负荷的相关性,探讨其在MPN疾病的作用。研究方法:本研究纳入2018年至2019年间于天津医科大学总医院血液科就诊的71例MPN初治患者(真性红细胞增多症(PV)32例,原发性血小板增多症(ET)22例和原发性骨髓纤维化(PMF)17例)
地铁是现代城市交通的重要工具之一,能够极大地缓解地上交通压力,减少燃油车的尾气排放,对于资源节约型、环境友好型社会的创建具有积极的价值。近年来,随着我国城镇化的迅速建设,很多大中城市都出现了难以缓解的交通拥堵,为此国务院相继批复了数十个城市的城市轨道交通工程,使得我国进入了地铁全面建设时代。地铁建设的价值是值得推崇的,但不能忽视的是,地铁建设工程十分复杂,在施工中伴随着很多风险,不仅会对施工的过程
装甲指控通信系统是装甲部队信息化建设的重要组成部分,在C4ISR系统中具有重要作用。本课题针对装甲信息化装备(包括:各类型通信系统、电气系统、火控系统等)及电子设备(装甲
本文主要研究具有C-M型功能反应函数的非均匀恒化器竞争模型.我们首先通过介绍恒化器的概念及其在科学研究和工业生产中的应用,恒化器模型的种类,概述Holling Ⅱ, Beddington