论文部分内容阅读
空气污染严重影响城市发展和居民健康,准确全面的空气质量数据,能够为环境部门制定污染治理策略和居民安排出行计划提供有用信息。城市中建设和维护监测站的费用非常高,所以在城市建设的监测站数量非常有限,从而导致大部分城市区域处于监控空白状态。城市中存在很多影响空气质量变化的潜在因素,空气质量可能在未来一段时间发生很大变化,提前知晓这些变化也非常有意义。所以空气质量预测问题有两个研究方向,一是预测未知区域的空气质量,二是预测区域未来的空气质量。现今大部分的研究工作分开解决这两个预测问题,并且很多预测模型并没有借助多源数据去分析潜在的影响因素。本文的研究将结合城市多源数据与深度学习方法来提高城市空气质量预测的准确度,主要工作及贡献如下:
① 针对监测站因传感器故障、检查和维修导致的数据缺失问题,本文提出了基于张量分解及重构理论的数据补全方法。张量重构恢复的缺失数据不仅能够提高历史空气质量数据的质量,而且实验证明通过该方法补全的缺失数据能够帮助提高空气质量预测模型的准确度。
② 针对空气质量在城市区域间存在相似性的问题,本文提出了双向和单向长短期记忆神经网络模型来捕获目标区域与相似区域之间空气质量的空间相关性和时间依赖,并利用捕获到的带时间索引的有用特征进行有效预测。模型在真实数据集上进行了实验,并对多个影响参数进行了讨论,实验结果证明其预测效果要优于多种常用的循环神经网络模型。
③ 针对空气质量存在多种潜在影响因素的问题,本文提出了深度时空融合网络模型来捕获空气质量与这些潜在影响因素的关系。首先利用皮尔森相关系数及各种图表工具分析空气质量与城市多源数据的相关性,例如实时气象、天气预报、地图兴趣点分布、道路网络和地理位置。总结出影响空气质量变化的三类影响因素,分别是相似区域影响因素、时间影响因素和空间影响因素。深度时空融合网络模型融合了 3 个子网,其中基于双向和单向长短期记忆网络的时空子网捕获区域之间空气质量的空间相关性和时间依赖,时间子网捕获时间相关因素对空气质量的影响,空间子网捕获区域内部因空间分布所具有的空气质量变化规律。实验结果证明该模型比2018年基于融合网络的DeepAir方法能够取得更好的预测结果。
① 针对监测站因传感器故障、检查和维修导致的数据缺失问题,本文提出了基于张量分解及重构理论的数据补全方法。张量重构恢复的缺失数据不仅能够提高历史空气质量数据的质量,而且实验证明通过该方法补全的缺失数据能够帮助提高空气质量预测模型的准确度。
② 针对空气质量在城市区域间存在相似性的问题,本文提出了双向和单向长短期记忆神经网络模型来捕获目标区域与相似区域之间空气质量的空间相关性和时间依赖,并利用捕获到的带时间索引的有用特征进行有效预测。模型在真实数据集上进行了实验,并对多个影响参数进行了讨论,实验结果证明其预测效果要优于多种常用的循环神经网络模型。
③ 针对空气质量存在多种潜在影响因素的问题,本文提出了深度时空融合网络模型来捕获空气质量与这些潜在影响因素的关系。首先利用皮尔森相关系数及各种图表工具分析空气质量与城市多源数据的相关性,例如实时气象、天气预报、地图兴趣点分布、道路网络和地理位置。总结出影响空气质量变化的三类影响因素,分别是相似区域影响因素、时间影响因素和空间影响因素。深度时空融合网络模型融合了 3 个子网,其中基于双向和单向长短期记忆网络的时空子网捕获区域之间空气质量的空间相关性和时间依赖,时间子网捕获时间相关因素对空气质量的影响,空间子网捕获区域内部因空间分布所具有的空气质量变化规律。实验结果证明该模型比2018年基于融合网络的DeepAir方法能够取得更好的预测结果。