医疗诊断报告自动信息提取系统设计与开发

被引量 : 0次 | 上传用户:yuezhongs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种医学信息系统在医疗机构中的投入使用,医院出具的诊断报告从纸质报告开始向电子报告转变。在实际应用中,国内的医学信息系统通常将检查描述、结论诊断等内容设置成自然语言的纯文本形式。医生在书写报告时可以比较自由地描述所见的情况,但这样的纯文本在进行检索时就遇到了检索困难和效率低下的问题。对于一些大型的教学、研究型医疗机构,医生经常在做特殊研究工作时需要对检查所见的情况,如一些疾病测量参数、疾病人群进行分类查询与统计。针对这一情况,有必要将这些医学描述信息进行提取处理,将文本中诸如疾病、症状、检查等多方面内容按照标准的医学术语集进行结构化分类,重新填入数据库,供医生、科研人员等进行查询使用,从而为医学研究统计提供有效信息。本文的主要研究了信息提取技术中基于隐马尔科夫模型的命名实体发现方法。针对医疗信息文本的特点,在进行识别之前先对文本进行预处理,采用机械识别和领域专家人工识别的方式将半结构化和非结构化的文本中可以初步识别的医学术语提取,然后在采用基于隐马尔科夫模型的方法来识别命名实体,采用基于过滤束搜索思想改进的Viterbi算法来计算隐马尔科夫模型中最优状态路径,以保证系统运行效率。基于规则的文本结构化,提取实体关系的过程中,通过短语成分组分析和重写规则拆分的方法,将文本信息拆分成片段,用于提取医学命名实体之间的关系。同时参考SNOMED CT术语集的体系架构,构建了一个易于理解和未来扩展的文本结构化框架。利用上述两种技术,针对医学文本研究的具体应用需求,设计开发了一个医学诊断报告自动信息提取系统,可以从医学报告中提取出所需医学术语和其属性描述。
其他文献
我国公司决策更多的是群体而非个体决策,群体决策强化还是弱化了过度自信偏差?本文从群体决策的层面研究了管理者的过度自信对公司并购绩效的影响。摈弃传统公司并购理论中的
<正> 提高混凝土的抗渗性,应采取控制混凝土配合各项技术参数的措施。防水混凝土的配合比应根据对混凝土强度、抗渗、抗冻等指标和原材料供应,外加剂选择等情况,按照《普通混
在知识经济和全球化时代,知识资源及科技成果的产业化、商业化正成为科技创新和推动经济社会发展的主要方式。在我国走自主创新道路,建立国家创新体系的新形势下,研究型大学
自由人,其职责是在比赛中专司接发球和后排防守,自由人在一定程度上改变了排球的攻守不平衡的状况,使比赛精彩程度提高,对排球运动的发展起到了巨大的推动作用。随着对规则认
随着网上零售业快速发展,如何提高网络消费者购买意愿已成为人们关注的焦点。论文运用感知价值理论分析了网络消费者购买意愿影响因素,提出了影响网络消费者购买意愿的重要研
中国的汽车制造业发展迅速,并且仍具有发展空间,而作为生产汽车的母机——汽车制造设备在中国的发展不容乐观。国内汽车制造设备与国外成熟的设备制造商相比,在产品质量和项
本文以河流系统诸功能与河流健康之间的关系为主线,从人与河流关系的发展与变化出发,探讨了原始自然阶段、工程控制阶段、污染治理阶段和河流生态系统修复和改善等四个阶段的
公司社会责任从其诞生之日起就伴随着争论而不断向前发展着,其定义、性质一直存在着争议。传统的公司理论中,公司的经营目标就是实现公司利润最大化,股东利益最大化,然而由于
本文基于喀斯特水资源与生态环境之间的耦合关系,建立了典型喀斯特流域水资源可持续利用评价模型,即采用模糊综合评判作为主要评价方法,确立了评价体系,通过改进层次分析法确
排污权交易制度是美国经过多年的环境管理实践探索出来的一种运用市场机制进行污染治理的有效手段,一些西方市场经济国家相继引入了此项制度,已取得积极的成效,近年来排污权