基于开源数据的流行病风险预测平台关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wawayu0bell212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着自然环境的改变,越来越多的流行病不断出现并威胁着人类的生命健康。因此我们有必要对流行病的致病因子进行研究并对未来发病趋势进行预测。流行病预测需要大量的发病病例以及相关属性数据,传统的研究方法过于依赖官方发布数据,这些数据往往会存在数据滞后的问题。针对此问题,我们引入了开源数据作为补充对流行病预测进行了研究,开源数据具有信息量丰富、更新速度快、结构复杂等特点。由于数据准备和获取阶段工作量较大,本文研究了数据自动发现的关键技术来解决此问题。在预测模型建立过程中,不同格式的数据需要转换为相同格式以满足模型输入要求,本文研究了数据自动组织的关键技术来简化多源异构数据的处理。在模型建立阶段,选择一个预测效果好的模型也很重要,本文研究了模型自适应选择关键技术来简化模型探索的过程。  针对上述存在的问题及其解决方案的关键技术,为了简化流行病预测的过程,本文设计了一个基于开源数据的流行病预测平台,该平台能满足不同种类的流行病的预测。本文的主要贡献有:  1.提出了基于开源数据的流行病风险预测平台的技术框架并实现了该平台,为流行病预测提供了较为方便的研究平台。  2.研究了数据自动发现、多源异构数据组织、多预测模型比较分析等关键技术,实现了对网络数据的自动发现与采集、异构数据的自动组织与处理、不同类型的流行病预测模型的自行选择,在一定程度上解决了数据滞后问题、简化了数据预处理过程以及快速准确的选择合适的模型。  3.以狂犬病风险预测为例,包括狂犬病病例的获取、属性数据的组织、模型的选择等过程,验证了平台的可用性。
其他文献
二十一世纪,人类进入大数据时代,大量历史数据的积累导致数据量高速增长,海量数据领域越来越被人们所重视,该领域涌现出了许多新技术。一方面,人们需要高效存储日益庞大的数据集;
比较是人们日常生活中常用的一种行为方式,对获取知识有重要意义。随着社会发展和技术进步,可获取的信息量与日俱增,通过对比分析能够得到的知识也更为丰富。但通过人工方式处理
学位
随着我国高等教育的飞速发展、教学改革的不断深入以及计算机技术在教学过程中的广泛应用,学校、老师和学生都对考试有了新的需求:学校希望有效地改进现有的考试模式,提高考试
互联网的快速发展为用户提供了大量的图像资源,如何从海量的图像资源中获取自己感兴趣的图像成为急需解决的问题。基于内容的图像检索技术是解决上述问题的有效手段,与传统的基
网络通信过程中,涉及各种各样的网元功能,既可能包含传统的如负载均衡,防火墙等网元功能,也可能包含特定的网络应用功能。将特定的网元功能有序地组合起来,让流量通过这些网元功能
学位
随着政府对社会民生建设的投资逐步增多,招投标工作也越来越多,为了保证选择最佳施工单位,提升工程质量和节约政府资金,把钱花在刀刃上,建设一个施工单位中介库抽取软件就很有必要
信息技术的发展加速了服务型开放智能网络系统的形成,资源与服务的建设、应用是其形成与发展的重要基础。面对日益增多的数字化信息资源、分布多态的功能服务,如何保证资源与服
近年来,随着我国空间科学的迅速发展,如何根据空间科学卫星的任务特点进行有效的任务规划,为科学研究提供灵活、快捷、高效的支持,以取得科学回报的最大化,是目前空间科学卫星工程