基于Stacking融合模型的郑州市PM2.5浓度研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:QiuWK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十世纪八十年代以后,随着我国经济飞速发展,空气污染问题日益显现。PM2.5污染严重时会使能见度持续降低,对人们的日常生活以及出行都造成一定程度的影响,因此探究PM2.5浓度与历史数据、其他大气污染物以及气象因子的关系有着重大意义。基于河南省郑州市2014年1月1日至2021年12月31日逐日PM2.5浓度和其他污染物(PM10,SO2,NO2,CO,O3)以及气象因子(平均气压,平均气温,平均风速,平均相对湿度)的相关数据,论文分别采用时间序列单模型和机器学习单模型,并基于单模型建立Stacking融合模型,根据拟合优度(R~2),均方根误差(RMSE)以及平均绝对误差(MAE)对建立的所有PM2.5预测模型的性能进行对比分析。论文的主要结果如下:首先,论文根据PM2.5浓度与其他污染物和气象因子的相关性选取研究变量,基于历史数据分阶段建立ARIMA预测模型,基于其他污染物和气象因子分别建立随机森林(RF)、Light GBM、支持向量回归(SVR)和Adaboost预测模型。单模型的预测性能相差较大,其中,拟合性能最好的是支持向量回归,拟合性能最不好的是ARIMA模型。其次,论文运用Stacking集成思想,将四个机器学习单模型集成为多种融合模型,模型的预测性能相差不大且整体较好,其中,拟合性能最好的是SVR-Adaboost—LR,拟合性能最不好的是RF-Adaboost—LR。最后,将机器学习和集成学习结合对PM2.5浓度预测结果进行对比分析,对于论文建立的所有模型,满足拟合性能最优的模型是SVR-Adaboost—LR,是最适合进行郑州市PM2.5浓度预测的模型。另外,集成学习对比其他机器学习单模型来说,预测性能得到了显著提高,并不是初级个体学习器的种类越复杂、学习器个数越多,最终的Stacking集成效果就越好,还需要考虑到初级学习器的种类差异和次级学习器的选择。
其他文献
氮化铝(Al N)是一种综合性能优异的新型陶瓷材料,其具有高热导率(320W/m K)、良好的耐腐蚀性、高电阻率、高硬度和耐磨性,在电子电力、机车、航空航天、国防、军工、通讯以及众多工业领域都具有广阔的应用前景和广泛的潜在市场。在铝基体表面形成的Al N层不仅能有效地提高其耐磨性能,而且能够拓展铝在半导体等电子行业的应用。传统制备氮化铝层的方法有直流反应磁控溅射法、化学气相沉积、等离子喷涂法、等离
学位
斜拉桥跨度大、索塔高度高,地震、强风等灾害对斜拉桥的安全性影响较大,斜拉桥抵抗多灾害能力已成为研究的热点之一。本文以某大跨斜拉桥为例,通过静动力等效建立索塔有限元模型;采用易损性方法,进行索塔地震易损性及风灾易损性分析;考虑地震、风作用方式及风速对易损性的影响,研究了地震-风共同作用下斜拉桥索塔多灾易损性。本文的主要研究内容如下:(1)以斜拉桥全桥模型静、动力特性为参考,考虑斜拉索及主梁的影响,采
学位
材料经渗碳热处理后会在其表面形成一定厚度的变质层,变质层的引入会改变材料的微结构和力学性能。在循环载荷作用下材料常常会表现出包辛格效应、循环软硬化、累积损伤等与单调载荷不同的力学响应特征,因此对材料表面变质层的力学性能,特别是循环特性进行研究对改善工件表面质量和提高关键构件的疲劳寿命具有重要意义。本文通过开展静态力学试验、循环加载试验和仿真模拟,分析了应变速率对不同表面变质层厚度的18CrNiMo
学位
配电线路是电力系统的重要组成部分,其运行状态对整个电力系统的安全可靠性具有显著影响。作为一种暴露在室外的杆塔式结构,配电线路中钢筋混凝土电杆电线体系结构对风荷载和地震等自然灾害反应非常敏感。历次地震灾害中,杆塔发生倾斜、出现构件局部损伤或倒塌整体破坏的情形时有发生,严重威胁我国电网的运行安全并对经济造成损失。目前我国规范对110kV以下的配电线路杆塔是否进行抗震验算并未明确规定,且国内外学者对配电
学位
随着我国经济增速放缓、人口红利逐渐消失,建筑行业面临着劳动力减少、人工成本快速上升的困境。同时,传统的现浇施工产生大量的建筑垃圾,对环境造成了严重的影响。因此,装配式建筑迎来发展契机,并持续推动建筑行业实现绿色可持续发展。而预制装配式混凝土楼板与预制墙体的连接构造是实现装配式建筑装配高效和性能安全可靠的重要保证。合适的连接方式使荷载在预制元件之间得以有效传递,并能提高节点的承载能力及延展性,对于预
学位
为了解决特大跨径拱桥系杆张拉合理方案难以确定的问题,提出了一种基于影响矩阵法的系杆张拉优化方法。该方法基于施工阶段系杆张力对结构内力、应力、反力等的影响矩阵,建立了施工阶段系杆张力与结构总响应的计算关系,给出了系杆张力在各类型响应约束条件下的可行域计算方法,以此求解出系杆张力在任意施工阶段约束条件下的可行域,解决了复杂施工阶段的系杆拱桥分阶段成形最优张拉计算问题。在跨径为507 m的目前世界最大跨
期刊
近年来,随着社会经济的增长以及人类生存范围的扩张,人类的活动对自然环境造成的影响越来越大,气象变化更加反复无常,导致降水量的波动性逐渐增强,由降水量过多或过少引起的灾害日益增加。降水量的多少直接影响到农业生产、水利水电、社会生产生活等,因此,准确地预测降水量对人类的生活和发展有重大意义和实际应用价值。论文主要利用郑州市1990年1月至2022年3月的月降水量数据进行研究,把1990年1月至2019
学位
斜拉索是大跨度斜拉桥的关键受力构件之一,其受力状态及几何参数的准确确定是开展结构设计分析和施工控制的重要基础和前提之一。针对这一问题,基于悬索解析理论以及数值求解技术,研究了斜拉索在给定目标索力条件下受力状态及几何参数等信息的快速高精度计算方法。首先,根据悬索解析分析,对适于工程应用的斜拉索线形、倾角及无应力索长等计算控制方程进行了分析总结,重点针对控制方程参数,在分析简单迭代格式的基础上,结合弦
期刊
滇西马厂箐铜钼多金属矿床位于三江特提斯成矿域,是一个与喜马拉雅期富碱斑岩侵入有关的多金属矿床。前人研究表明,马厂箐铜钼多金属矿床形成于斑岩-矽卡岩成矿系统,但由于缺乏系统矿物学研究,目前对矽卡岩矿化过程和成矿效应仍不清楚,限制了对该矿床成矿过程的全面认识。因此,本文以马厂箐矿床矽卡岩型矿化中的石榴子石为研究对象,利用H-O同位素、电子探针(EPMA)以及LA-ICP-MS原位微区技术开展了同位素及
期刊
信贷业务是商业银行等金融机构的核心业务之一,而智能风控模型是信贷业务的主要技术手段,也是大数据算法的主要应用场景之一。但是,在风控模型建立过程中样本不平衡现象是普遍存在的亟待解决问题之一。本文建立了基于混合采样策略与代价敏感方法相结合的样本不均衡处理模型,在模型中首先基于混合采样策略调整正负样本比例,然后依据代价敏感方法训练模型。本文采用Kaggle竞赛数据集“Give Me Some Credi
学位