基于MapReduce的医疗临床大数据筛选机制研究与应用

来源 :中国人民解放军海军军医大学 | 被引量 : 1次 | 上传用户:lichiuyun13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床医疗数据的筛选查询是医学工作的重要内容,是数据处理、数据查询技术在医疗领域的重要应用。有效的筛选方法和查询机制有助于医疗数据的挖掘利用,支撑信息统计、个性化医疗、决策辅助、随访跟踪、药物研发、健康管理、精准医疗等数据应用需求。临床医疗数据的筛选查询主要面临两个挑战:一是数据量大,大规模数据的存储和计算超过了传统关系型数据库的性能极限;二是数据结构类型复杂,尤其是非结构化的数据需要特定的处理方法。本文针对当前医疗临床数据的特点,研究临床数据分布式计算办法,主要利用开源大数据工具Hadoop技术,结合MapReduce计算模型,提出多结构医疗数据的并行筛选机制。该机制采取平台统筹、分类处理、易于扩展的设计思想,把不同类型结构的数据纳入统一的MapReduce计算平台。本文主要分别实现在平台中对结构化的表单数据、时间序列数据以及病历文本数据的查询计算,并优化筛选查询算法,解决医疗临床多种结构数据的分布式计算和跨结构筛选的问题,提高查询效率。本文主要研究内容如下:1.海量医疗结构化数据的分布式存储与查询优化;2.海量医疗时间序列数据的分布式索引创建与查询优化;3.海量医疗文本数据的分布式索引和查询;4.医疗临床大数据筛选平台。本文的创新点如下:1.提出一种采用MapReduce架构下的数据仓库技术Hive来解决海量医疗结构化数据的分布式存储和查询优化问题的技术。2.提出一种基于MapReduce的分布式时间序列索引DB-DSTree。本文提出的利用DHD索引并行化DSTree索引,并且利用批量查询的局部性进行分组的方法,可以有效解决DSTree的非平衡性,使得批量查询的效率得到显著的提高。3.提出一种基于MapReduce的海量文本的分布式存储与查询方法。4.基于医疗结构化数据、医疗时间序列数据、医疗文本数据的分布式存储和查询方法,建立了医疗临床大数据筛选平台。
其他文献
Hainan Island is the second largest island in China. It is situated on the Nanhai Sea(South China Sea) and faces Guangdong Province across Qiongzhou Strait (海
道德与法治课程设置的意图是使学生拥有积极健康的生活态度,拥有积极参与社会生活的意识和行动力,但在课堂教学实践中,学生在课堂上参与的积极性并不高,多数学生选择“巧坐静听,低头沉默”,为了打破这种课堂模式,就需要学生真正参与到实际课堂教学中来。那么目前道德与法治课堂上参与度低的原因是什么,又怎样解决呢,便是本文的出发点和落脚点。本文通过采用课堂观察、问卷调查以及个人访谈的方法对相关数据进行分析后,总结
提高车辆的舒适性和操纵稳定性是车辆技术研究的重要方向,性能良好的悬架则能够最大程度地隔离地面不平给车身带来的振动冲击。以被动悬架为基础辅以电磁反力式作动器的混合
随着新媒体新技术的飞速发展,信息技术与小学语文教学的深度融合也成为了新课程改革面临的一项重要任务。网络学习空间正是在国家政策驱动、技术不断发展以及教与学方式变革
英语是世界上最活泼、最富活力的语言之一,在具体的语境中,许多由常用单词组合而成的习惯用语、俗语被赋予了新的含义,幽默诙谐、充满活力又有鲜明的时代特色。读者在阅读英
期刊
我公司计划将一条长250 m、内宽2.5 m的辊道窑改为生产600mm×600mm×20 mm,600mm×1200mm×20 mm,900mm×1800mm×20 mm规格的超厚仿古砖,请问潘工,生产这种厚度达2 cm的超厚砖坯,在辊道干燥窑的干燥过程中,应注意哪些事项?  答:从你提问得知,该超厚仿古砖,其厚度为20 mm,比普通仿古砖产品厚约10 mm,而根据其它生产同样厚砖的生产经验得知,
目的 分析护理实习生产生抑郁的相关因素,为预防和减轻抑郁的发生提供理论参考,以提高护理教育质量.方法 采用病例对照研究策略,选择在成都市第四人民医院护理实习50名男生和
好莱坞再也不能在韩国电影院中称王称霸。韩国曾向美国寻求创意,但是现在风水轮流转了。好莱坞正在争抢几十部韩国电影的重拍权。Hip-hop明星奎恩·拉提法的下一个工作方
期刊
随着生活水平的不断提高,旅游已经不再是老百姓的“奢侈品”。但是,“黄金周”假期出游往往变成摩肩接踵的看人海模式,为了有个更好的放松体验,很多游客会选择乡村旅游,享受几天住农家院、吃农家饭、赏农家景的休闲日子。巨大的市场需求潜力和良好的经济效益,给乡村旅游的发展提供了动力,很多有优势自然资源的地方,政府就会引导乡村旅游的发展,乡村旅游为农民提供了新的就业门路,带动了大量农民在家乡就业,也大大增加了农
随着计算机技术的发展,智能移动机器人在各个领域的应用越来越频繁。移动机器人在执行各种复杂操作时,同时定位与建图(Simultaneous Localization and Mapping,SLAM)是真正实现移动机器人自主化的关键。采用视觉传感器的SLAM是目前的热门研究方向,其中能够同时获取深度图和彩色图的RGB-D相机为视觉SLAM提供了新的发展方向。本文针对RGB-D SLAM存在的特征点匹