论文部分内容阅读
目前,我国大部分医院都利用自己的管理信息系统,进行业务处理和信息管理。但日益增加的海量数据,使面向联机事务处理的传统数据库技术无法满足医院管理者的高层次决策分析需求,历史数据浪费严重。
通过与绵阳市盐亭人民医院的沟通合作,在该院现有信息系统数据的基础上,采用自底向上的方法,充分利用医院历史数据,完成了数据仓库的构建、联机分析处理技术的应用、以及数据挖掘算法的实现,为医院管理者的决策支持活动提供了依据。
首先进行了历史源数据的采集和规整,构建了数据仓库概念模型、逻辑模型,并进行了数据的转换、加载和访问。
其次,基于数据仓库底层数据,运用联机分析处理技术,建立了医院多维数据集,实现了数据的切片、切块、钻取和旋转,完成了医院信息的多维数据分析。
再次,利用ID3决策树算法和Apriori关联规则算法,完成了费用主题中病人特征与费用金额的决策树构建以及不同费用类别间的关联规则发现,并对FUP增量更新算法进行了改进,提高了数据更新后的挖掘效率。
最后,在已构建的医院数据仓库和OLAP数据分析的基础上,利用 Analvsis Service中集成的决策树和聚类两种数据挖掘算法,建立了针对主题的数据挖掘模块,完成了相应的可视化分析,进一步提高了医院信息的决策支持能力。