多组合分类器在局部区域气温预测中的研究与应用

来源 :广东工业大学 | 被引量 : 6次 | 上传用户:proudboy_linux_wzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步、信息化的发展、气象研究技术的提高,气象领域积累的数据量与日俱增。如何从海量的气象数据中发现有价值的信息是气象科研人员的一项重要任务。气象信息与人民的生活息息相关,人民的生活和生产制造直接受天气的影响。如果能将数据挖掘应用到气象数据中充分挖掘出可用的信息,不仅能提高天气预报准确率和灾害天气预警能力,还能指导当地的工农业生产和提高人民的生活水平,造福人民。在数据挖掘中,分类是一种非常重要的技术。现有的分类技术有决策树、贝叶斯、支持向量机、神经网络等,这些分类器都是单分类器。随着人们对分类器性能要求的提高,相关领域学者提出了集成学习的概念。所谓集成学习就是对同一个问题用多个单一的个体学习器进行组合学习,组合分类器就是将多个不同的分类器(基分类器)通过一定的方法组合起来构建而成的一个组合分类器。因此,组合分类器就是分类器的集成,同时也叫分类器的组合。实验证明,多个分类器组合在性能上超越于单分类器的性能。本文在对气象数据的特点、气象数据挖掘现状和常用的气象数据挖掘方法进行了分析的基础上。利用数据挖掘中的决策树分类方法和集成学习思想构建组合分类器,并用来对广州某局部区域气象站搜集的历史气象数据进行分析和研究。本文主要开展了下列研究:1.设计并实现了基于决策树的并行组合分类器预测模型,将组合分类器和决策树分类方法用于局部区域的气温预测中,各基分类器分别对局部区域的气温进行预测,组合分类器综合各基分类器的结果,最后获得各基分类器的协同预测。2.基于C4.5决策树算法,设计并实现了Bagging、Adaboost两种组合模型,同时基于CART决策树设计了随机森林模型。3.针对局部区域气象数据,应用了Bagging、Adaboost和随机森林三种组合分类器,分别设计并实现了局部区域气温预测模型。4.应用某局部区域的气象数据,验证了Bagging、Adaboost和随机森林三种气温组合预测模型的有效性,进而对三种模型的预测结果从准确率和性能上进行了细致的比较分析。本文的研究成果,为当地的气象局提供了决策依据,给当地居民的社会生活和工业生产提供了指导性的效果。
其他文献
随着互联网技术与信息产业的发展,以及各种图片分享类网站的出现,如今我们已经步入图像时代。图像是一种直观的媒体资源,在日常生活中扮演着重要角色。图像分类是计算机视觉
随着嵌入式系统网络化、智能化应用的不断扩展,传统软件实时操作系统作为支撑软件已无法满足需求。基于硬件化、软硬件协同等手段,在FPGA、SOC等器件上实现硬件实时操作系统已
随着互联网的飞速发展,在线社群图像的规模呈爆炸式增长,面对日益庞大的图像数据,如何对图像库进行有效的组织、管理和检索成为亟待解决的问题。标签是当前标注这些网络图像
实值优化问题在工程和学术领域有广泛的应用背景,许多问题最后都可以被定义成实值优化问题来求解。随着系统越来越复杂,需要优化的参数越来越多,优化问题解空间的维度越来越
MapReduce作为一种有效的数据分析和处理解决方案已被广泛应用于大规模数据处理领域。随着MapReduce应用的扩大,越来越多的服务提供商对外提供MapReduce商业服务。服务提供商
我们生活在一个相互关联的世界。大多数数据或信息对象、组件等是内部关联或者相互作用的,形成了无数的、巨大的、相互关联的复杂网络。不失一般性,相互关联的网络称为信息网
随着电子商务的发展和社交平台的广泛应用,以社交网络平台为载体的社交电商成为人们购物的新渠道。社交平台的用户使用量逐年递增,社交电商的潜在用户数量也随之递增。由此,
排序学习是当前信息检索与机器学习领域研究的热点问题之一,它在诸如文档检索、协同过滤、自然语言解析等领域有广泛的应用。排序学习的目标就是应用机器学习技术自动地从训
随着云计算发展,软件开发作为一种服务已经受到越来越多的关注。为了让独立软件开发商(ISV)能够将精力集中在核心业务应用的开发上,更加方便、灵活、快捷地构建SaaS系统,平台
无障碍检测是保障网页内容无障碍访问的基础。在对政府网站的检测过程中,我们发现曾经达到无障碍访问要求的网站中,部分网页新增了存在障碍的内容,例如图片没有替代文本。因此,为