论文部分内容阅读
伴随时代的进步,工业、农业的迅速发展,在经济快速增长的同时,带来的自然环境的破坏,洪涝灾害、雨雪冰冻等极端天气在近年不断出现,降水量的预测深受人们关注。目前国内外关于降水量预测的研究,通过气象学的原理,结合计算机技术来建模,主要的预测方法有灰色理论、马尔可夫理论等,通过挖掘历史的数据特征来寻求雨量变化规律。近年随着机器学习、模式识别学科的兴起,神经网络方法和支持向量机方法,也有不少学者应用于降水量预测中,但神经网络的准确度不高、支持向量机的参数选择也没一定的依据和原则。 商空间理论是三大粒度计算理论之一,从数学模型的角度提出了通过等价关系构造不同粒度空间的方法,分析了不同粒度上的模型特征、相互关联性,诠释了针对不同的需求可以提取不同粒度上的信息,将不同粒度上的信息特征进行合成得到原空间上的问题的解。本文结合商空间粒度计算理论,对特征属性中存在强弱相关属性的区别问题,寻找合适混合粒度下的特征属性,即为特征属性生成过程。为了剔除高维属性中的冗余信息,对多侧面递进算法改进得一种新的特征属性选择算法。针对有差异的特征属性子集,应用多分类器融合技术来构造学习器,为降水量预测建立一套新的预测方法。 本文的主要工作包括: 1.介绍了降水量预测的研究背景和研究现状,并对目前已经使用的方法进 行分析,指出了它们的不足,重点阐述了分类器集成模型及其特点。2.简要的概述了商空间粒度计算理论中的保真、保假原理和完备半序空间的构造,以及在商空间理论的指导下,构造气象数据的特征属性,旨在不丢失信息的前提下,强化主要的属性,弱化次要的属性,并在半序空间中选择出合适的混合粒度的方式。 3.介绍了特征属性选择的概念和常见的特征属性选择方法。详细讲述了多侧面特征选择方法和多侧面特征属性选择集成预测模型。多侧面选择算法是在多侧面递进算法(MIDA)的基础上进行改进来获取特征属性子集。这些特征属性子集正是识别问题的一个个“侧面”,并介绍了基于多侧面特征选择的集成预测模型。这个模型可以克服气象数据影响因子众多,影响原因难以确定且样本数量少的特点,实现准确的预测。 4.将多侧面特征属性选择集成预测模型应用于月降水量预测之中。首先结合气象学的知识,通过商空间理论构造出初始的训练样本的特征属性。然后利用多侧面特征选择算法选择出多个互异且互补的特征属性子集,使预测样本在各个子集所构成的子空间上进行“识别”,并将结果应用集成学习理论进行分析。最后将预测的实验结果和其他的方法进行比较,体现出优越性。