论文部分内容阅读
随着生活水平的日益提高,人们对健康的关注度也随之增加。多种疾病的爆发、发展和传播与气象条件存在密切的联系,分析气候环境变化对人群健康的影响,对于天气敏感性疾病的预防预警存在积极意义。然而,随着气象因素数量的不断增多,如何高效的获取潜在的价值信息用于疾病的预测,已经引起广大学者和相关研究机构的广泛关注。目前,国内外关于气象要素对疾病影响研究的方法多为多元逐步回归分析、人工神经网络法和传统决策树方法,根据不同气象环境下的疾病数据的特性分析气候变化与疾病之间的关系。但是,这些研究方法对初始数据集有较高的要求,忽略了不同日期的气象因素之间具有的密切关联性和相似性,而且是在有限的历史数据集上建立模型,没有考虑到最新的气象信息数据对疾病的影响更有参考价值。针对上述问题,将具有时间序列的气象数据当作流数据处理,本文提出了两种天气敏感性疾病预测算法。基于流数据的JacUOD算法的疾病预测模型首先在通过滑动窗口技术筛选的数据集上计算目标日期与历史日期气象因素之间的相似度,选取相似度最高的Top-N历史日期气象数据用于预测目标日期的疾病就诊人数值,充分利用气象因素之间具有的密切关联性和实时的气象数据;基于流数据的决策树算法使用时间滑动窗口技术抽取最新的气象数据,结合决策树算法建立疾病预测模型,在动态的数据集上选取最新的气象数据用于疾病预测。采用以上两种方法对天气敏感性疾病进行预测,借此提升算法的预测准确率。结合以上提出的预测算法,完成“天气与健康”APP原型的设计开发,实现北京市常见9种天气敏感性疾病的预测。通过实验表明本文所提出的这两种疾病预测算法在充分利用最新的气象数据信息和气象因素之间具有的密切关联性的同时,大大提升了疾病预测的准确率。