基于证据理论的决策森林的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:edisonckw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式分类算法是数据挖掘研究的一个热点和难点问题,相关算法在许多领域被广泛应用。由于在许多工程实践中,分类精度是评价算法性能的重要指标。所以,高性能的集成方法近年来受到研究人员的广泛关注,多分类器集成就是其中一种提高分类精度的有力武器。多分类器能提高精度的潜在原因之一在于:它能综合不同分类器的信息,避免单一分类器可能存在的片面性。那么,如何有效“融合”不同分类器的信息就成为其最为重要的关键技术。   本论文主要采用证据理论的方法对多决策树进行集成。证据理论已被证明在信息融合、目标识别、知识推理等领域有着广泛的应用前景。同时,它作为一种推理方法,在解决不确定性问题中具有显著的特点。本文所提方法的基本思路是:首先对决策树输出的信息进行不确定表征,即对输出证据的基本概率分配进行赋值;然后,利用证据组合规则对多决策树进行集成。   本文的主要研究工作概括如下。   首先,分析了数据挖掘、数据挖掘的分类器——决策树的基本理论和方法,并建立随机决策树和随机森林的模型,为研究基于多分类器融合的分类算法打下基础。   其次,对证据理论的相关内容进行了系统的研究,为研究多分类器的融合方法提供理论支持。   最后,研究多分类器融合理论,利用证据理论对多决策树输出的信息进行融合,建立基于证据理论的决策森林的模型,并在UCI标准数据集上进行仿真实验,结果表明此方法是有效的,它能有效提高分类器的精度和泛化能力。   本文的工作对于集成学习的研究具有一定的参考价值。  
其他文献
本文针对北京铁路电气化学校教务管理的需要,设计与实现了基于B/S架构的教务管理系统,选择了SQL SERVER 2000作为数据库,系统的开发采用了ASP动态网页技术,实现了系统登录、
软件测试在软件开发过程中有着越来越重要的地位。它贯穿于软件定义与开发的整个期间即整个软件开发过程。从设计规格说明中产生测试用例是测试阶段的一项重要工作,而它的主要
隐通道问题使实施自主存取控制和强制存取控制的多安全级软件系统有了新的挑战,成为开发高等级可信软件系统过程中的难点和关键问题,在国际上得到了充分的重视。信息流分析法
实时系统因为其响应速度快,可靠性高的特点,在经济,军事,科研,运输等领域扮演着重要的角色。当前处理器由于较高的能量消耗,导致处理器热量散发的提高及系统可靠性的降低,同
由曲面的二维灰度图像重建其三维形状已经成为计算机视觉领域的一个研究热点。对该问题进行了深入的研究,提出了一种从单幅图像出发,采用轮廓线进行旋转曲面重建的方法。该方法
学位
空间关系与人类认识、改造现实世界的活动息息相关,它是人类对于地理空间认知结果的高度概括,是人类所形成的空间概念中最重要的基本组成部分,是进行空间描述、推理与分析的
随着现代社会日益趋于网络信息化,网络信息系统在日常生活中扮演着越来越重要的作用。虽然各种传统的安全措施提高了网络信息系统的安全性,但各种攻击、故障和意外事件还是会
实验室和实训基地是高校尤其是高职院校的重要教学场所。随着计算机应用技术的普及和和公共计算机实验室对外开展业务逐步增多,因人为原因和流行网络病毒对实验室软件、网络
学位
随着互联网信息的飞速发展,信息的增加在满足人们对信息需求的同时也给人们快速、准确的查找所需要的信息带来了一定的难度。在这种情况下,自动文摘系统成为研究的热点。 在