基于自然语言处理技术的消化科内窥镜检查报告的结构化

来源 :浙江大学 | 被引量 : 0次 | 上传用户：zhuanghaiyang

【摘要】

：

在医院的现代化管理中，病历作为医疗活动信息的主要载体，不仅是医疗、教学、科研的第一手资料，而且也是对医疗质量、技术水平、管理水平等进行综合评价的依据。欲在大量的检查报

【作者】

：

李俊杰

【出处】

：

浙江大学

【发表日期】

：

2007年期

【关键词】

：

自然语言处理 MST 语义网络结构化消化科内窥镜检查报告

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在医院的现代化管理中，病历作为医疗活动信息的主要载体，不仅是医疗、教学、科研的第一手资料，而且也是对医疗质量、技术水平、管理水平等进行综合评价的依据。欲在大量的检查报告中抽取符合一定条件的文档进行分析并总结(如研究某种疾病的易感人群的年龄段及地域分布等规律，某种症状与某种疾病之间的关系)，对病历进行文本分析是开展上述工作的必要途径之一。在医院诊疗过程中，病历的录入，尤其是诊断报告的录入，目前大部分的系统还是选用医生自由录入的方式，这就形成了大量的叙述性报告。医院作为一个特殊的领域，日信息吞吐量极大，用户要在海量数据中得到自己需要的数据是十分困难的，这为在自由文本中对某些信息进行统计、查询带来一定的困难，同时大量非结构化，非标准化的文本信息也不利于医院之间的信息共享与统计。因此，对自然语言表达的病历文书进行结构化的研究探索是一件十分有意义的事情。目前，电子病历的研究开发人员提出了很多实现结构化的方法，大多数是采用结构化表单录入的方式，但是这种方式不能表达自然语言的所有语义信息。本论文从自然语言理解的角度出发，基于现有的自然语言处理技术的成果，以内窥镜检查报告为例，对自然语言表达的病历文书进行结构化研究。本论文的主要工作包括：利用现有的自动分词研究成果，对文本报告进行初步分词。本论文采用中国科学院自然语言处理研究所开发的分词系统ICTCLAS作为初步分词的基础件。对初步分词结果进行进一步的调整。利用专业词典进一步识别MST(Minimal Standard Terminology)标准词汇，以及能够转化成标准MST词汇的非标准MST词汇。对分词结果进行文本解析，输出结构化内容。分析MST标准的结构特点以及MST标准术语之间隐含的相互关系，借鉴UMLS超级叙词表的关系数据模型及与语义网络框架，建立MST语义网络知识库，利用这个知识库，分析每个词汇的语义类型以及相互关系，输出符合MST标准的结构化报告。本论文的重点在于对设计方法的研究。在实验中本论文以胃镜检查报告为实验数据，得到的叙述性报告转化到MST结构化报告的准确率为92.3％。从最初的设计到应用于实际这一过程证明，本论文提出的基于自然语言处理技术的消化科内窥镜检查报告的结构化，方法简单，能够比较有效地完成叙述性报告到结构化报告的转化，为实现电子病历的结构化，提供了一种尝试性的方案。这种方法可以应用于电子病历的其他部分，最终能够实现电子病历的完全结构化、标准化。

其他文献

先天性梨状窝瘘的影像、细菌谱及内镜CO2激光烧灼研究

研究背景：先天性梨状窝瘘(congenital pyriform sinus fistula, CPSF)是胚胎发育早期咽囊闭合不全导致的颈部鳃源性畸形,包括第三鳃裂畸形和第四鳃裂畸形。本病罕见,左侧多发,

学位

先天性梨状窝瘘影像学细菌学内镜术式

能上能下双效突出

也许有人要问，这个时代还有必要读主题书吗?请来看看2016年的主题出版，你会发现，原来主题出版也可以这样生动有趣、形式新颖。也许很多出版社都在担心主题出版带不来经济效益而

报纸

滇西北程海流域干热河谷区造林树种选择

程海流域地处金沙江干热河谷区,天然植被稀少,生态环境脆弱,造林难度较大,树种选择适当与否是造林成败的关键因子。文中阐述了程海流域现有的植被分布情况和主要造林树种,对

期刊

程海流域金沙江干热河谷造林树种选择Chenghai River Basindry-hot valley area of the Jinsha River

滇西国有林场改革绩效分析与评价——以腾冲市为例

为探索建立国家、国有林场、林场职工、林区群众四者共赢互利机制,促进保山市国有林场可持续发展,以新时期国有林场改革工作为背景,选择腾冲市为研究对象,通过参与式农村评估

期刊

国有林场改革绩效分析参考式农村评估(PRA)森林资源保护经营机制腾冲市state-owned forest farm reformperforman

选矿工程

磁链受力分析在磁选回收率计算中的应用;赤泥中钛硫酸浸出的工艺条件及动力学研究;浮选柱充填方式及其优化;超声波和微波联合加强氧化脱除煤中有机硫;活性炭纤维湿氧化改性表

期刊

选矿工程循环流化床煤与瓦斯突出区域预测燃煤特性力学性能高混凝土锅炉设计

培黎国际学院植物景观设计

基于植物造景的基本原则与方法,以甘肃省张掖市山丹县培黎国际学院的植物景观设计为例,研究适用于西北地区的校园植物景观设计方法。在满足校园功能要求的基础上,遵循适地适

期刊

校园植物景观植物配置设计原则功能区西北地区campus plant landscapeplant layoutdesign principlefunc

昆明至丽江高速公路绿化美化设计思路

对昆明至丽江高速公路路域环境进行调查,在充分掌握其本底的前提下,从公路产权内、外的绿化景观现状、全线景观风貌、自然景观、人文景观,以及负面环境影响因素等方面对景观

期刊

路域环境绿化美化设计思路昆明至丽江高速公路road environmentgreening and beautificationdesign ideas

河北省主导产业与高等院校产学研结合问题研究

产学研合作是指政府、企业、大学和科研机构为了社会经济发展的战略性目的，协同各自拥有的资源（资本、人力、技术），通过团队合作，对科学技术以及相应产品（或服务）的共同开发。其直接

期刊

主导产业高等院校产学研

医院防范化解重大风险的策略分析

医院运行中存在诸多风险。文章基于风险管理理论,分析了重大风险防范的相关政策要求,总结出医疗安全、生物科技、综合治安、思想政治、廉政责任、财务运营、信息安全及灾害事

期刊

风险管理医院管理防范化解重大风险risk managementhospital managementpreventing and defusingmaj

形成能上能下机制提升干部队伍素质

10月8日，质检总局党组印发《质检总局推进领导干部能上能下实施办法（试行）》（以下简称《能上能下办法》）。就《能上能下办法》的制定过程和贯彻落实等问题，质检总局人事司负责人接

报纸

基于自然语言处理技术的消化科内窥镜检查报告的结构化

与本文相关的学术论文