论文部分内容阅读
决策树算法是数据挖掘中应用最广的归纳推理算法之一,其构造不需要任何领域知识或参数设置,适合于探测式知识发现。决策树算法具有结构清晰、运行速度快、准确性高以及更好的灵活性和鲁棒性,可以用于处理高维数据,其获取的知识是直观的且容易被人理解。目前决策树算法已经被广泛的应用于医学、制造和生产、金融分析、天文学、分子生物学以及遥感影像分类等领域。遥感影像分类是进行遥感影像解译的主要手段之一,其基本思想是通过对遥感影像中各类地物的光谱、空间、几何、纹理等信息的分析,选择特征,利用一定的手段对影像中的每个像素或者是分割对象进行归类,按照分类对象的不同,可以分为基于像元和面向对象两种。为了减少人工工作量,提高分类效率,最邻近、最大似然、支持向量机、模糊聚类、决策树和神经网络等分类算法作为分类手段被广泛应用于基于像元的分类方法中,同时在面向对象分类中,也使用了最邻近、隶属度函数、支持向量机和决策树等分类算法。当遥感影像数据特征的空间分布很复杂,利用决策树算法往往能获得理想的分类结果,且其生成的决策树或规则集可以供专家分析和修正,并输入到专家系统中。目前已经有很多研究者将多种决策树算法成功应用于遥感影像分类中。但是在这些研究中,决策树的生成大多依赖于现有的数据挖掘软件,缺少对决策树算法的深入研究和改进,也缺少相应的分类软件。本文在对决策树生成算法和boosting推进技术研究的基础上,以BoostTree算法为基础,通过算法改进,构建了AdaTree.WL算法。然后以该算法为基础研发了决策树遥感影像分类系统。依托该系统分别对Landsat ETM+和WorldView-2影像进行了基于像元和面向对象分类,并与其它分类算法进行了比较。主要研究内容和成果如下:(1)通过对多种决策树算法的研究、比较和分析,以复合决策树BoostTree思想为基础,首先根据遥感影像分类的特点,构造了新的单棵决策树生成算法,该算法可以看作是对C4.5算法的改进;然后改进了AdaBoost算法与决策树的结合方式以及最终的预测函数,最终构造了本文中的组合决策树算法AdaTree.WL,并利用该算法设计实现了GLC树分类器。(2)分析总结了当下流行的遥感影像分类方法,根据遥感影像分类原理,将上述决策树算法成功应用于基于像元和面向对象两种遥感影像分类方法中,并进行了相应的软件设计与实现。该软件不仅实现了基于像元的遥感影像分类,并且可以在获得影像分割的基础上,实现对分割结果的自动分类,克服了以往利用决策树进行遥感影像分类时依赖现有数据挖掘软件的问题。(3)利用Landsat7ETM+影像和WorldView-2影像分别进行了基于像元和面向对象分类实验。试验中,分别将本文所构建的AdaTree.WL算法同BoostTree、C5.0决策树算法,以及支持向量机分类算法进行了比较。实验表明,本文构造的决策树分类算法在分类精度上与C5.0算法在伯仲之间,并优于上述其它算法,平均Kappa系数分别达到0.9052和0.9398。同时利用AdaTree.WL算法进行遥感影像分类,可以通过计算特征贡献度的方式对参与分类的特征进行筛选,提高分类效率。