基于Xgboost算法的雾霾预测模型研究与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:xuan_98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国的雾霾研究大都是从2011年美国大使馆公布Pm2.5数据之后开始的。近年来雾霾在华北地区呈辐射性扩散。我国长三角地区也属于雾霾重度污染地区。只要空气回暖气压降低,就会有大面积的雾霾现象出现。应用数据挖掘算法实现对雾霾的预警预测成为降低雾霾危害的有效手段。1.本文对影响Pm2.5浓度的因素进行了描述性分析和选择,包括主成分分析和随机森林特征排序法,最后选择了 5个影响最大的变量建立预测模型,包括风速、风向、气压、湿度和温度值。2.通过数据验证比较了多元回归、逻辑回归、时间序列、Adaboost算法和Xgboost算法5个常用模型。根据整体的预测效果和稳定性,选择了 Xgboost算法作为本文研究预测雾霾的模型。3.详细介绍了 Xgboost算法的目标函数及其处理过程。在使用Xgboost算法建立模型时对训练数据进行了异常值处理和特征离散化处理,并通过调整目标函数,使得模型的预测AUC得分增长了 0.05,提升了分类准确率,并对算法的收敛性进行了分析。通过运用改进后的Xgboost算法模型,实现了雾霾的精准预测。
其他文献
纳米燃油是指由纳米粒子与基液燃油混合而成的固-液两相共存的纳米流体燃油。纳米粒子增强的表面作用能及粒子与燃油分子间的相互作用力改变了燃油的基础物化参数,已被证实在
飞秒激光具有高功率、高精确度、热影响区小等优点,可直接去除表面材料,实现微纳加工,在航空航天、半导体、生物等材料表面加工领域具有不可替代的优势。镁合金不仅是一种轻
随着社会经济发展、城市化进程的不断深入以及人口数量的不断增长,交通需求日益增长,智能交通系统成为未来的发展方向。交通监控系统作为智能交通系统中的重要组成部分,城市
近年来,随着环境污染问题的日益突出以及化石燃料的日渐耗竭,人类急需开发清洁,廉价以及可再生的新能源以替代传统的化石燃料。在现已开发的新能源中,直接甲醇燃料电池(DMFCs
高脂血症是由脂质代谢紊乱引起的一种病症,是心脑血管疾病的诱因之一,严重威胁着人们的身体健康。酸马奶是一种经微生物发酵的传统乳制品。我们前期研究发现,酸马奶可以调节
随着天然气凝液回收的目标产品不同,衍生了不同的处理工艺。以HSZ气田气体性质作为基础数据,针对低压天然气,分别模拟计算了以乙烷和液化石油气两种主要产物的工艺过程。天然
镁合金作为可工程化应用最轻的金属结构材料,具有比强度、比刚度高,切削加工性能优良,导热导电和电磁屏蔽性能优越和环境相容性良好等优点,在汽车、通讯电子等领域有着广阔的
快速的城镇化发展导致建筑及其拆除的废弃物以每年数十亿吨的规模增长,传统的处理废弃物的方法是仅仅将其进行简单的堆埋,不仅占有宝贵的土地资源,还会对环境造成一系列的污
目前,多目标跟踪技术已经广泛的应用在我们生活中的各个方面。多目标跟踪任务涉及的场景具有复杂性:存在目标的进入和消失、目标被频繁遮挡等现象。多目标跟踪算法运行时会由
有机污染物的植物角质层-水分配系数(Kcw)对评价其植物累积和潜在风险具有重要意义。由于有机污染物和植物的种类繁多,采用实验方法逐一测定其Kcw耗时且成本高昂,目前为止,仅