【摘 要】
:
决策树归纳算法出于其实现简单,归纳能力强而逐渐成为了最常用的机器学习算法之一。但当要处理的问题类别个数增多时,传统的决策树算法由于产生的单一决策树过于复杂,而出现
论文部分内容阅读
决策树归纳算法出于其实现简单,归纳能力强而逐渐成为了最常用的机器学习算法之一。但当要处理的问题类别个数增多时,传统的决策树算法由于产生的单一决策树过于复杂,而出现概括能力降低,预测精度下降的问题。针对该问题,本文提出了一种基于类间最大间隔理论的多级决策树归纳算法,多级决策树的主要思想是首先把多类别问题转化成正反两类问题来产生第一级的决策树,然后把正子类再细分为正、反两类来产生第二级的决策树,同理把第一级的反子类也细分为正、反两类来产生第三级的决策树,在第二级的得到的正反两类重复上面的工作,直到把所有类别都分开。本文将最大间隔理论引入到了多级决策树归纳中,以期在每一级划分正反子类时能得到较优的划分。本文在阐述算法思想和步骤的基础上,通过与传统的决策树算法进行实验对比,得到了如下结论:多级决策树算法能够得到条数较少、概括性更强的规则,从而能够有效提高训练和测试精度。因此,该算法在多类别的分类问题及相关应用领域中具有明显的优势和潜力。
其他文献
一般的系统都是在外界持续扰动力作用下工作的,这些扰动不仅导致系统的性能下降,甚至使系统失稳。由于变量测量、信号传递延时等因素的存在,时滞现象普遍存在,例如输油管道中
数据库技术的发展与推广使越来越多的应用领域在信息化的过程中受益。而随着一些新型领域的兴起,为适应其发展需求,数据库技术也在不断地扩展和丰富。其中,分布式实时数据库就是
数字图像去噪,自从被提出以来就一直是图像处理领域的基本课题之一,其难点在于无法对所有类型的图像使用同一种去噪方法而都得到很好的去噪效果。传统的去噪方法便是针对图像
随着信息技术和数据库技术的广泛应用,数据的存储规模越来越大,而数据挖掘(KDD)作为一种可以从海量数据中自动、高效地提取有价值的信息和知识,以有效地支持决策的新技术,引
随着Web服务技术的快速发展,网络上具有相同功能的Web服务越来越多,这些Web服务的区别在于其QoS的不同。用户在使用Web服务时,面临的问题是如何从这些具有相同功能的Web服务中,选
作为一种工程承载构件,钢丝绳在使用的过程中不可避免地会存在磨损、断丝等缺陷,钢丝绳在工程中的广泛应用使得对钢丝绳的缺陷检测具有重要意义。小的缺陷所产生的漏磁场往往
Internet的迅猛发展,尤其是Web的全球普及,使得Web上的信息量无比的丰富。通过对Web数据的挖掘,不仅可以得出关于群体用户访问行为和方式的普遍知识,用于改进Web服务设计,更重要的
随着雷达和电子对抗技术的发展,复杂电磁环境的分析与研究越来越受到人们的重视。目前,复杂目标的电磁散射已经成为了一个热点研究问题,在预估雷达散射截面方面有许多方法被提出。其中,图形电磁计算方法(Graphical ElectromagneticComputing,GRECO)被认为是用高频近似法分析电大尺寸复杂目标RCS的最有效的方法,受到了广泛地应用。本文采用图形电磁计算方法对雷达照射范围内的目标
众所周知,在现实世界中,几乎所有的控制系统都不可避免地受到外界干扰的影响。除了完全未知动态特性的外部扰动外,还有一类已知动态特性的外部扰动,具有这类扰动的系统在航空
随着计算机硬件和3D扫描技术的快速发展,离散网格及其处理已经成为几何造型和计算机图形学领域中的热点研究内容,其研究成果已广泛应用于制造业,娱乐业,游戏工业等领域。网格