基于LSTM的雾霾重污染过程预警研究——以西安市为例

来源 :西南大学 | 被引量 : 0次 | 上传用户:liangxiaolong43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大气污染综合治理攻坚行动方案的进行,全国重点区域空气质量不断好转。然而,汾渭平原等地区秋冬季雾霾重污染天气仍时有发生,对人体健康和社会经济造成重大影响。因此,对其雾霾重污染事件进行准确预测具有重要意义。作为雾霾的主要成分,PM2.5的形成过程涉及非常复杂的大气物理化学过程,对该过程进行机理建模和求解难度较大。因此,本文采用基于深度学习的数据驱动模型提取雾霾重污染过程监测数据的时空变化特征,实现对雾霾重污染的准确预警。长短期记忆网络(Long Short-Term Memory,LSTM)能够有效提取PM2.5时间序列的非线性特征,然而传统LSTM难以完全捕捉PM2.5时间序列的复合特征,参数知识难以解释。针对以上问题,本文主要进行了如下研究:(1)为了提高雾霾重污染样本的预测准确率,同时为雾霾重污染过程中雾霾主要影响因素与目标雾霾浓度的关系提供解释,以LSTM为基础融合了具有可解释性的多元线性回归(Multiple Linear Regression,MLR),设计了一种基于深度时间序列特征融合的可解释性神经网络模型(Multiple Linear Regression and Long Short-Term Memory,MLR-LSTM)。该模型利用具有不同超参数的单变量LSTM对当前PM2.5浓度、PM2.5前体物以及气象因子时间序列的深度特征进行提取;采用MLR对单变量LSTM输出的时间序列特征进行融合,最终输出PM2.5浓度预测值。为验证模型有效性,使用汾渭平原2015年1月4日至2020年12月31日的空气质量监测数据以及气象监测数据进行建模,预测了西安市未来3 h、6 h、12 h、24h的PM2.5浓度并对其预测效果进行了评估。实验结果表明,在3-24 h的PM2.5浓度预测中,MLR-LSTM模型对PM2.5重污染样本的预测准确率分别为94.12%、85.29%、77.57%和51.10%,平均绝对误差分别为10.66μg?m-3、21.30μg?m-3、28.05μg?m-3和48.01μg?m-3,显著优于随机森林(Random Forest,RF)、支持向量回归(Support Vector Regression,SVR)、MLR、单变量LSTM(LSTM_PM2.5)、多变量LSTM(M_LSTM)以及RF-LSTM(Random Forest and Long Short-Term Memory)。此外,当预测步长由3 h增至24 h的时候,MLR-LSTM模型的融合层系数显示当前PM2.5浓度对目标PM2.5浓度的影响力由80.89%急剧降至16.34%,前体物浓度的影响力由5.23%上升至29.43%,说明提前采取重污染应急措施对雾霾浓度和污染持续时间消峰降速效果具有显著影响。(2)PM2.5浓度时间序列具有明显的周期性,为进一步探讨模型在雾霾重污染过程中的可解释性,本文构建了耦合周期、趋势的空气重污染演变过程预警模型(Prophet and Long Short-Term Memory,Prophet-LSTM)对汾渭平原的西安市未来6 h、12 h、18 h、24 h的PM2.5浓度进行预测并分析PM2.5浓度在不同时间尺度中的分布变化。该模型利用Prophet对PM2.5时间序列进行分解以获取PM2.5浓度各个时间尺度的变化趋势及周期信息;利用不同超参数的LSTM提取PM2.5时间序列的深度特征以及趋势特征;以线性组合的形式融合Prophet与LSTM输出的各个子序列特征,最终输出PM2.5浓度预测值。实验结果表明PM2.5浓度随时间的变化呈如下变化现象:在年际趋势中,2018以后开始持续下降;在年周期中,最低值在每年的夏季出现,最高值在每年的冬季出现;在周周期中,最低值在一周中的星期五出现;在日周期中,最高值在每天凌晨出现,最低值在下午六点左右出现。在6-24 h的PM2.5浓度预测中,Prophet-LSTM模型对PM2.5重污染样本的预测准确率分别为85.29%、74.45%、64.15%以及53.49%,均方根误差分别为25.98μg?m-3、36.60μg?m-3、46.24μg?m-3以及54.00μg?m-3,均优于Prophet、RF、差分整合移动平均自回归(Autoregressive Integrated Moving Average model,ARIMA)、SVR、LR以及LSTM模型,能够实现对西安市雾霾重污染过程的准确预警。(3)PM2.5重污染样本在总体数据中只占据7.83%,数据分布极不平衡,对模型训练造成了影响。为进一步对PM2.5重污染样本进行研究以提高重污染样本的预测精度,本文提出了一种基于重加权的重污染预测模型(Piecewise LOSS Function and Long Short-Term Memory Model,PLF-LSTM)对汾渭平原的西安市未来6 h、12h、18 h、24 h的PM2.5重污染样本进行预测。使用重加权方式对损失函数进行分段处理,给予小样本数据集(重污染数据)与大样本数据集(非重污染数据)不同的权值,降低数据分布不均衡对模型训练的影响。同时,通过采用供暖季阶段的PM2.5浓度数据进行研究以增加小样本数据集比例。实验结果表明,在6-24 h的PM2.5浓度预测中,引入分段LOSS函数的PLF-LSTM模型对PM2.5重污染样本的预警准确率分别为86.21%、74.59%、67.88%、59.35%,均高于未引入分段LOSS函数的LSTM模型,并且没有增加PM2.5浓度的误报率,甚至可以同时降低误报率,说明单独对小样本数据集分配权值有利于提高模型对PM2.5重污染样本预测准确率,同时降低误报率。综上所述,MLR-LSTM提高了模型预测性能的同时使得该模型参数具备可解释性,在一定程度上量化了雾霾污染过程中的主要影响因素对目标PM2.5浓度的影响;Prophet-LSTM针对PM2.5时间序列的周期性进行了分析,显示了在不同时间尺度中PM2.5浓度的分布情况,同时提高了模型对PM2.5浓度的预测性能;PLF-LSTM降低了偏正态分布数据对模型训练的影响,提高了PM2.5重污染样本预警准确率的同时降低了PM2.5重污染样本的误报率。由于过程相似性,上述方法也具备预测传统化工过程物质浓度的潜质。
其他文献
目标检测和视觉导航是无人驾驶的关键技术。传统的道线检测依赖于特征提取和检测校正,交通标志识别依赖于色彩分析和图像分割,然而道路场景的剧烈变化导致算法的鲁棒性较差。基于模拟的无人驾驶场景,本文探究深度学习模型LaneNet和YOLOv4,以完成智能车的视觉导航与目标识别。针对不同识别任务,文章采取传统视觉与深度学习结合的方式,保证算法的鲁棒性与实时性。在室内模拟场景中,智能车的无人驾驶系统能够准确实
期刊
钟秉林教授的新版著作《高考改革:理想与现实》,聚焦新高考改革,基于访谈和问卷调查等实证研究方法,对新高考改革进行持续的跟踪评估,为推进新高考提供理论支持,是新高考改革研究的重要成果。该书既肯定新高考的成效,也直面问题,为完善新高考提供改革参考。该书所收录的多篇论文曾对新高考改革的政策调整与实践改进起到实质性推动作用,产生了较大的社会效益和学术影响。
期刊
聚类,也称为聚类分析,是最基本和最重要的无监督学习范式之一。它旨在根据数据样本间的相似度情况,将样本划分到不同的簇(组),分配到同一个簇中的样本的相似性高,不同簇中的样本的相似性低。传统的聚类算法仅能从给定的数据中找出一个聚类结果。然而,由于数据采集和存储技术的进步,人们所分析的数据更为复杂,其中可能包含不同种类的异构特征。例如,数据集中的特征可能包含不同量纲的特征或采集自多个来源。这些特征的不同
学位
为提高智能车在不同速度和载荷下的路径跟随精度和稳定性,提出一种基于反馈纯跟踪的智能车路径跟随方法。首先,基于车辆运动学模型和纯跟踪模型分析影响控制效果的因素;然后根据车辆速度和路径曲率动态调整前视距离,将横向偏差作为反馈变量对传统纯跟踪控制方法进行补偿;接着通过仿真试验选定控制参数,分析控制参数对路径跟随精度和车辆稳定性的影响;最后通过实车试验,验证该方法在实车环境中的控制性能。结果表明,该方法具
期刊
共识算法是区块链系统中重要的组成部分,具有维持数据一致性、保障系统安全性的作用,对区块链系统的性能有很大影响。联盟链与公有链相比,节点数量较少并且存在准入机制,因此普遍使用基于投票的共识算法,例如Raft共识算法和PBFT共识算法。Raft共识算法具有通信时间复杂度低、吞吐量高、时延低、可理解性强等优势,极大地提高了对交易的处理能力,推动了联盟链项目落地。然而Raft共识算法仅能容忍故障错误,无法
学位
文本分类是自然语言处理领域的一项关键任务,并被广泛应用于虚假信息检测、情感分析、自动问答等现实场景。传统机器学习方法需要人工提取特征,这种复杂耗时的方案不再适用于当下大量实时涌现的文本流。深度学习的兴起解决了这一问题,能自动处理大量文本信息。但是,基于深度学习的方法局限于文本内部单词交互,忽略文本之间的联系以及单词的全局共现关系,难以解决长距离依赖和非连续性问题。最近,基于图神经网络的方法在文本分
学位
人脸是人类生物识别的重要信息载体,是人类起源以来最为重要的生物特征之一,它能够表达一个人独特的身份信息、情感信息等。随着计算机视觉与计算机图形学的发展,科学家们开始着力于用于分析人脸的相关计算工具与方法。近年,便携式数码设备被迅速普及,人脸图片的获取相较于过去也变得更容易,使得对人脸的分析可以在不同的领域得到广泛的应用,比如人机交互、动画制作以及安全防控等。同样,随着三维技术的快速发展,利用三维重
学位
环状开沟施肥作业能够有效的提高肥料利用效率,减少环境污染,并能对果树滴水线周围的土壤进行有效的破碎与根系的修剪。本文在系统分析国内外研究现状并结合果树环状开沟施肥农艺要求后,提出了一种适合丘陵山区果园作业环境,能够完成环状开沟、施肥、覆土联合作业的果园环状开沟施肥装置。对装置的各部件进行方案设计并完成计算选型;对关键部件开沟施肥部件进行结构设计和理论分析,并采用离散元法对开沟施肥部件进行仿真分析,
学位
烟草作为我国重要的经济作物,在国民经济生产中占有重要地位。2020年中国烟草种植面积为108.1万公顷,烟草产量达213.4万吨。而烟苗前期的生长状况对后期烟苗的长势和烟叶质量具有重要作用。高效科学的剪叶是保证烟苗长势整齐、培育出健壮烟苗的重要手段。由于我国烟草农业机械起步较晚,早期大部分烟苗剪叶工作都是通过人工来完成。虽然近些年,部分高校和烟草公司研制出了相关的烟苗剪叶机械,但多为大中型机械,并
学位
随着我国大力推进乡村振兴以及能源结构优化,农作物传统干燥方式已逐渐不适应,亟待发展先进的干燥工艺和新型干燥设备。因此,开展农作物干燥特性及干燥工艺研究,同时进行干燥状态参数监测及控制策略研究,提升干燥设备及工艺的自动化、智能化具有非常重要的意义。青花椒作为西南地区最重要的经济作物,具有很高的食用和药用价值。本文以重庆青花椒为研究对象,结合青花椒叶绿素降解相关原理,通过研究青花椒的干燥特性和干燥过程
学位