模糊聚类决策树的研究与改进

来源 :河北大学 | 被引量 : 0次 | 上传用户:liongliong528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树算法是应用最广泛的机器学习算法之一,它基于一个无次序、无规则的样本数据集,试图从中提取出描述此样本数据集的数学模型。传统的决策树算法只能处理属性为离散值的样本,如果其属性是连续值则需要通过属性离散化进行预处理。离散化机制必然会导致样本信息丢失,进而影响决策树性能。近些年,有些学者开始将模糊聚类算法与决策树相结合,构造出模糊聚类决策树,从而避免了对连续值属性的离散化,进而降低了数据信息的丢失。本文首先研究了模糊聚类决策树的结构,树的生长机制以及树中节点停止扩展的准则。在此基础上,基于传统的模糊聚类决策树无法处理未知类别的样本这一不足,本文进一步提出了一种新型的无监督模糊聚类决策树模型。在没有样本类别信息参与的情况下,通过制定新的节点分裂标准,构建了无监督的模糊聚类决策树,从而将模糊聚类决策树算法推广到无监督学习中。最后,实验比较了基本决策树算法C4.5,传统的模糊聚类决策树以及改进后的无监督模糊聚类决策树的性能。实验结果表明,本文提出的无监督模糊聚类决策树在没有样本类别信息引导的条件下性能较优,并且树的规模较小。
其他文献
随着大数据时代的到来,数据的维度越来越高而且数据中的冗余信息越来越多,统计学习和机器学习从包含大量的冗余信息的数据中学习或发现有用的信息越来越困难,因此在对数据建
分布式信息处理、传感器技术、网络技术的发展推动了多传感器数据融合技术的发展,该技术目前已被广泛地应用于军事和民用的各个领域,在各个方面对人们的生产和生活起了积极的
随着计算机技术、人工智能以及计算机网络技术的快速发展,计算机快速转向开放的、网络平台的、协同工作方式,在这十多年来,源于分布式人工智能(Distributed Artificial Intel
无线Mesh网络(Wireless Mess Network)简称WMN,是一种新型的无线通信网络。它具备网状的拓扑结构的自组织性和自愈特点,并具有有效的移动用户管理和跟踪机制。无线mesh网络既
列车运行系统(TOS)是铁路智能系统(RITS)中的核心系统,也是典型的混杂系统。如何对TOS进行建模分析是RITS研究中的关键问题。由于TOS是一类强实时性的反应系统,其动态行为与
从《机器能思考吗》一文的发表开始,人工智能已经经历从专家系统到神经网络,再到今天统计学习理论几个阶段,这期间涌现了大量优秀的算法和理论。但我们也看到,在智能领域尤其
学位
随着“互联网+”概念的提出,计算机相关技术的应用逐渐与传统的行业结合在一起,为其在现代化的发展道路上创造了新的契机。然而在发展的过程中,传统行业的进步也对计算机技术
机器博弈是人工智能的一个重要研究领域,它在人工智能中的作用与果蝇在遗传学中的研究所起到的作用相似。机器博弈研究的大量成果已经被应用到很多实际的领域当中,如天气预报
随着视频编码技术、网络基础设施、信息家电以及消费电子的迅速发展,以视频内容为核心的流媒体服务已成为信息产业中最具发展前景的业务之一。基于典型的分布式系统Internet
决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行分组,使组内的数据相似性最大,组间相似度最