论文部分内容阅读
近年来,中国城市面临着严重的空气污染问题,雾霾天气频繁发生,人们的生活、身体健康以及生态环境都受到严重影响,而以PM2.5为主的大气污染物则是加剧城市空气污染的关键因素之一。因此,掌握大气PM2.5浓度的变化规律、污染水平及相关影响因素,探索合适的大气PM2.5浓度预测模型,对于控制城市大气污染有着重要的科学意义,并且能够为公众的出行安排和政府部门的相关决策提供一定的依据和帮助。本文以北京市海淀区万柳监测站点为研究对象,搜集2014年3月1日-2015年4月30日的大气污染物浓度及相关气象因子等数据,采用数理统计方法对不同季节,不同小时的大气PM2.5浓度的变化规律和相关影响因素进行了研究,同时采用机器学习方法对大气PM2.5进行了小时及日均浓度预测。本文的主要研究内容包括:1、采用数理统计分析手段对当前站点的大气PM2.5浓度的变化规律及相关影响因素进行了分析。研究结果表明大气PM2.5浓度存在一定的季节性变化和每日逐时变化规律,且大气PM2.5在秋冬季表现为较严重的污染,同时PM2.5一般表现为夜间高于白天的污染趋势。另一方面,相关性分析结果表明PM2.5浓度与温度、风速均呈现较弱的负相关关系,而与气压、相对湿度则呈现较弱的正相关关系。同时PM2.5与CO、NO2和SO2在四个季节均表现为较显著的正相关关系,而与O3在四个季节的相关性表现并不明显,只是在冬季表现出了较显著的负相关关系。2、通过建立基于网格搜索的支持向量回归(Support Vector Regression,SVR)的大气PM2.5浓度预测模型,对直接多步预测方法和迭代多步预测方法进行了比较。结果表明,随着预测步长的增加,两种预测方法的预测误差均会增大,而迭代多步预测方法由于误差累积效应,导致预测误差急剧增大。因此,直接多步预测方法被选为大气PM2.5浓度预测的主要方法。3、由于SVR模型中的三个参数(惩罚因子、不灵敏度系数和核参数)对模型的性能影响极大,为了提高预测精度,本文引入量子粒子群优化(Quantum Particle Swarm Optimization,QPSO)算法对支持向量回归模型的参数进行优选,从而建立了QPSO-SVR预测模型,利用该模型实现了大气PM2.5的未来4小时浓度预测。结果与粒子群优化(Particle Swarm Optimization,PSO)-SVR模型、遗传算法(Genetic Algorithm,GA)-SVR模型和网格搜索(Grid Search,GS)-SVR模型的预测结果进行对比,表明提出的QPSO-SVR模型从预测精度、运行速度以及鲁棒性能方面,都优于其它三种模型。4、考虑大气PM2.5浓度时间序列的非线性和非平稳性等特点,本文引入“分解与整合”的预测方法,提出了CEEMD-QPSO-SVR的混合预测模型,实现了对第二天大气PM2.5的日均浓度预测。结果表明,与经验模态分解(Empirical Mode Decomposition,EMD)和集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)方法相比,互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)在大气PM2.5浓度的时间序列分解上效果更佳,并且“分解与整合”的预测方法比单一预测方法的预测精度更高。