基于机器学习的单站点PM2.5浓度预测及其时空影响因素研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:luffyzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国工业化和城镇化的快速发展,空气污染问题日益突出。PM2.5作为主要空气污染物之一,因对人体健康产生巨大威胁而被广泛关注,成为了空气质量预警的重要指标。对PM2.5浓度进行及时准确预测可为人们户外工作和活动提供指导,对降低PM2.5的健康风险具有重要意义,是目前PM2.5研究领域的热点问题。随着计算科学的发展和大量实测数据的累积,基于统计模型的PM2.5浓度预测逐渐兴起,其中预测效果较好的机器学习方法是PM2.5浓度预测模型发展的主要方向之一。但是,在利用机器学习方法进行单站点PM2.5浓度预测时,如何有针对性地选取必要的关键因子作为输入参数,以及对于具有空间特性的关键因子应该考虑多大的空间范围,目前尚缺乏足够研究。而该问题的研究有助于简化机器学习模型,提高建模与运行效率;有助于通过机器学习揭示影响PM2.5浓度变化的主要因素及其相互作用,因地制宜地制定有效防控措施;有助于为PM2.5监测站点的合理选址提供参考。本研究以上海市十五厂环境空气质量监测站(国控站编号:1142A)为例,选取不同空间范围内不同时空变化因子,构建了一系列随机森林回归模型预测该站点未来1~24小时的PM2.5浓度,结合对RMSE等常用精度统计指标和污染事件空报率、漏报率等业务指标的分析,以及对颗粒物大气输送过程中气象要素影响的机理分析,对模型中空间信息范围的确定方法及各因子对于不同时长浓度的预测影响进行探究,从而探索一种可将机器学习与站点本地特点相结合的,具有较高PM2.5浓度短时预测可靠性的建模方法。本文主要研究内容及成果如下:(1)通过调整输入因子,分析了在不考虑周边的情况下,预测站点自身的PM2.5历史浓度、时间要素和气象要素对于该站点PM2.5浓度预测的影响。结果表明,前1、2小时的PM2.5浓度对于短时预测具有重要影响;添加时间要素(即预测时的月份、星期和时刻)对预测精度改善很小;添加最近站点气象要素对未来8-24小时预测精度的改善较为明显,但对污染事件空报率和漏报率的影响较有限,甚至有负面影响。(2)提出了一种基于时间滞后互相关分析的周边关键站点选取方法,并用该方法选取了在不同预测时长下与预测站点相关的代表性周边空气质量站点。结果显示,入选的周边站点随着预测时长的增加而向预测站点西北方向由近及远分布,与预测站点外来PM2.5源的位置及其随风向输送的轨迹吻合,反映出该方法符合颗粒物传输的物理机制,具有可推广性。在模型中加入周边空气质量站点PM2.5浓度能明显改善预报精度和空报率。在此基础上,进一步选取各入选空气质量站点周边缓冲区内的气象站点,将其加入预测模型,可达到与使用全部气象站点几乎相同的预测精度。可见,本方法能选取出符合颗粒物传输物理机制,且对预测站点不同时长的预测最具代表性的周边站点,从而可有效减少机器学习模型的输入噪声特征数量。(3)建立了考虑多种因子的预测站点PM2.5浓度预测随机森林回归模型。结果显示,考虑预测站点自身的前1、2小时历史浓度、周边站点PM2.5浓度和周边气象要素的多因子预测模型总体上具有最佳预报精度和最低的空报率与漏报率,在第24小时的预测中,与只考虑历史浓度的对照模型组相比,MAE由21.2μg/m3下降至16.6μg/m3,RMSE由28.3μg/m3降至22.5μg/m3,空报率和漏报率则分别降低了24%和21%。相比于仅考虑全时间序列包含大量优良天气状况的预测精度指标,考虑了空气污染事件的空报率与漏报率指标更具有针对性和实际意义。
其他文献
学位
人口作为城市研究的基本要素之一,是度量城镇化水平的重要指标,掌握精细的人口分布数据对城市的科学规划和管理、内部资源分配、应急防灾、生态环境评估等领域都有重要的作用。传统的人口调查方式可以获得精细的人口分布,但存在成本高、更新频率低等局限,因此遥感技术成为进行大范围人口估算的主要方式之一。大量的遥感数据,尤其是可以测量建筑物三维形态信息的LiDAR数据,已被证明能够用于建筑物尺度的人口估算。然而已有
学位
学位
学位
学位
学位
学位
学位
学位