论文部分内容阅读
空气质量指数(AQI)是衡量空气质量状况的重要指标,如何准确迅速地预测未来一段时间的AQI已成为一个热点问题。空气质量网格化实时监测预警预报系统的出现为实时预测某一区域的AQI提供了可能。但随着样本数量的持续增加,预测下一个时间点AQI的计算量也逐渐增大,影响了预测的实时性。虽然数值预报模式能够对未来多个时间点的AQI进行预测,但由于其预测准确率较低,单靠数值预报模式已不能满足人们的要求。针对以上问题,本文提出了一种AQI实时预测模型,根据应用场景不同,该模型在实时处理模块分为了两个预测器:单点AQI实时预测器和多点AQI实时预测器。针对预测下一时间点的AQI实时性较差的问题,本文根据AQI的计算特点和KNN算法的基本思想,建立了一种单点AQI实时预测器。本文选取北京地区近四年的气象数据和空气质量数据构建样本集进行实验,通过交叉验证法确定了 K的取值,然后使用Storm分布式流数据处理框架对KNN算法进行了分布式拓展,使得预测器能够实时预测下一时间点的AQI。针对数值预报模式预测的AQI准确率较低的问题,本文提出了基于KNN和卡尔曼滤波的组合预测算法KNN-KF。KNN-KF算法首先将KNN算法历史预测的AQI作为卡尔曼滤波的系统状态,使用最小二乘法求解卡尔曼滤波的估计方程和测量方程得到状态向量初值;然后利用卡尔曼滤波算法的递归方程根据过去24小时KNN算法预测值组成的预报因子和实况值求得订正系数;再利用KNN算法根据气象和空气质量数值预报数据得到未来24小时AQI的中间预测值;最后利用订正系数和中间预测值求得订正值。并且本文还将风力因素添加到系统状态、预报因子和订正因子当中,以进一步降低预测误差。最后本文利用Storm将KNN-KF进行分布式拓展,建立了高准确率的多点AQI实时预测器。本文通过实验验证了单点AQI实时预测器和多点AQI实时预测器的准确率和性能,得到了较为理想的实验结果。