基于Hadoop医学数据平台的数据清洗

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:longlong2ddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医院信息化的不断深入和普及,病人的电子病历、药物信息、诊治记录和病人的个人信息等,存在着重复、不完整或错误的数据,无法在数据库中清晰明了地获取每个病人的信息,因此医学数据清洗应运而生。实现一个基于Kettle工具和Python语言的数据清洗平台。平台使用Kettle工具和Python语言对简单的医学重复数据、医学错误数据及医学不完整数据按照设计的清洗流程以及清洗规则进行清洗,之后通过Kettle转换存储到Hadoop平台的Hive数据仓库中,从而得到有价值的医疗数据并应用到医疗大数据分析和挖掘中。
其他文献
影视翻拍本不是什么稀罕事.自电影电视出现之后,被翻拍过的作品不胜枚举.其中虽不乏超越以往的经典,但其中的一部分则流于平庸甚至落得个"东施效颦"的骂名.尽管如此,国内不少投
林业前期投入大无回报,但后期收益稳定。从长远来说,林业产业化发展对县城经济发展的稳定性起到极大的促进作用。文章通过对近年来从江县林业发展情况的总结,论述林业在实现从江
不知你发现没,无论行走涉县的圣福天路、云中天路,还是峰峰的壁挂公路、响堂天路,那干净整洁的路面,如画如诗的景观,人间仙境的奇妙,步移景异的震撼,似彩练当空舞,若珍珠连成
目的针对幼儿气管异物取出术时容易忽略的护理问题和危险因素,探讨手术的配合要点.方法 1)根据幼儿的生理和心理特点,尽量减轻患儿的哭闹和心理创伤,提供适宜的手术环境温度
英雄,作为人类理想人格的终极化身,是人类永远的光荣和梦想。在这个充满物欲和喧嚣的后现代消费时代,大众文化中层出不穷的英雄母题,其大多数结果是开出一朵朵有英雄之名而无
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield