基于Hana的医疗大数据多维度挖掘

被引量 : 10次 | 上传用户:panshuangchun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人口老龄化问题日趋严重,我国的医疗费用占GDP比重的提升,以及医疗大数据领域将产生万亿市场价值等多因素的带动下,医学领域已经开始拥抱医疗大数据,并将其应用于医学研究、医学临床以及医学管理等各方面的实践。医疗机构对患者进行诊断和治疗过程中产生的数据统称为医疗数据,包括患者个人信息、就诊记录、医疗报告、医学影像数据和检验指标数据等。以上海瑞金医院来为例,日均需要接待上万人次的患者前来就诊,这么多数据汇集在一起,成年累月的增长量非常考验该医院数据库容量的存储能力。在长时间内进行有效的数据管理外,对这些医疗大数据进行数据挖掘使其能够帮助医院进行运营决策则是一个值得研究的课题。医疗行业在走向信息电子化的过程中就已经遇到了海量数据和非结构化数据的挑战,特别是近年来“大数据”概念的盛行,大公司们提出了很多关于医疗大数据的解决方案。针对这种情况,开展医疗大数据相关研究工作对医院的信息化发展是有着重要意义的。本课题基于Hana平台,结合对联机分析处理系统(OLAP)的研究,设计了一套用于支持多维度复杂查询的可视化系统,并在多维度数据集的基础上进行相关的数据挖掘工作,从而找到患者临床医疗大数据间潜在的未知知识。本文首先对上海瑞金医院在线应用系统中产生的临床数据进行预处理,给出了多张数据表的业务说明以及关联关系,并阐述了临床医疗数据的OLAP模型。在此基础上,本文通过分析系统的可行性与功能需求,从而设计了临床医疗数据的多维度可视化系统,分别介绍了系统中的四个主要的模块:数据预处理模块、数据建模模块、数据挖掘算法模块以及数据可视化模块。针对多病种情况,本文进行专门的数据分析。根据甲亢患者重要指标的检验情况,可以将甲亢患者治疗过程分成四个阶段:临床缓解阶段、生化缓解阶段、免疫缓解阶段以及免疫治愈阶段,而且每个阶段都可以出现治疗复燃情况。通过对不同阶段的患者数据进行分析,可以统计得出甲亢患者在不同阶段的治愈率。而糖尿病属于长期高血糖症状,检测指标众多,但往往多对指标组合存在强相关性。所以通过对糖尿病患者指标检验数据的分析,可以得到某对指标的潜在关系,从而为合理减少患者的多余检验检测提供了数据支持。最后,为了验证数据分析结果的有效性,本文还使用多种挖掘算法(关联规则算法、聚类分类算法等)对患者的检验报告、检验指标以及用药情况等数据等进行挖掘,通过对比而得出一些辅助性的医疗结论,这些结论可以为将来疾病的病因起源分析提供一定的理论支持。
其他文献
做好农业类高校食品专业人才的"输出"建设,即供求相应下所培养的人才为社会所需,是一个内涵十分丰富的问题。本文从食品类企业对人才的实际需求出发,考量农业类高校人才培养模
目的:通过给昆明(KM)小鼠灌服蜂胶液四周并于最后一次游泳训练至力竭实验,观察训练后小鼠心肌脂质过氧化损伤程度,探讨蜂胶抗氧化、保护心肌组织、提高机体抗疲劳能力的作用
司法信息化建设是科学利用司法资源,提高审判质量效率的重要手段和保障。其中法院审判管理信息化建设对于提高司法公正和效率意义重大,尽管信息化技术本身存在一些问题,但审
长方形网格中最短路径数算法的探究518028深圳实验学校方善泽在学习教学内容的过程中,许多人常常只注重看懂.而在解决数学问题的过程中,他们又往往只注重找到一个答案或方法.至于对数学
幼儿舞蹈创编是幼儿舞蹈教学的一个重点内容,更是一个要要任务,本文从幼儿舞蹈的学习者和教育者角度,对幼儿舞蹈创编能力的培养进行了多角度的思考和探索,促使幼师生的舞蹈创
概述现代药品物流的界定和供应链管理模式的内涵,探讨和分析在我国药品物流领域实施供应链管理的意义和基本要求。
基本不等式的应用031106山西平遥县东泉中学曹思才课本(均指高中《代数》下册(必修))推证了基本不等式:这些基本不等式是解题的重要工具,但应特别注意应用的正确性、广泛性、灵活性.下面举
财务困境本质是财务困境相关研究的基础,但对此理论界重视不够,受此影响造成部分研究领域研究进展缓慢,部分研究结论的理论解释能力和实践指导作用受到局限。鉴于此,本文在对
政府控制型社会保障体系面临政府管理机构重叠、公共服务供给效率低下、社会保障领域的道德风险丛生等问题。网格化管理的实质是大数据时代通过互联网平台实现政府各部门资源
信用交易机制是沟通货币市场和资本市场之间资金流动的重要通道,因其所特有的功能和运作机理而成为发达国家证券市场上通行的交易机制。在我国证券市场,因人们漠视其功能,顾