基于粗糙集理论的多分类器组合应用研究

来源 :四川师范大学 | 被引量 : 7次 | 上传用户:sngt73
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术及通信技术的发展,各行各业产生了大量的数据,为了揭示数据中隐含的规律,数据挖掘技术应运而生。目前,主要的数据挖掘方法有决策树、神经网络、回归分析、遗传算法、粗糙集、聚类等。其中,粗糙集理论以数据的分类能力为基础,在缺乏先验知识的情况下,能够解决潜在的、不确定的或含糊数据中的知识获取问题。它已在模式识别、特征选择、故障诊断等领域取得了成功应用。传统的分类方法常采用一个分类器进行分类,这就要求这一分类器能在所有的数据样本上都有较好的分类能力,这是难以实现的。多分类器集成理论为解决单个分类器分类能力的不足提供了有效方法。但作为机器学习领域的一个重要课题,多分类器集成在粗糙集理论中的应用还没有受到广泛的关注。基于以上背景,本文把粗糙集理论引入多分类器集成,研究了基于粗糙集理论的集成学习方法,主要内容如下:1、对基分类器的构造方法进行了研究。本文根据Rough set理论、C4.5算法、NB算法等三种不同的分类算法对训练数据集随机训练得到三种类型的基分类器,包括粗糙分类器、贝叶斯分类器和决策树分类器。2、对基分类器的差异性构成进行了研究。根据分类器集成理论,基分类器差异性越大,分类器组合的分类效果就越好。本文在两个方面体现了基分类器的差异性:一是基分类器是根据训练数据集随机生成的;二是基分类器采用三种不同类型的算法训练得到。3、提出多分类器集成策略及方法。为了达到最好的集成效果,本文首先训练多个不同类型分类器,并将训练数据集按照决策属性值分为多个子集。再根据K-means方法将测试数据集分为同样多个聚类集,并通过欧式距离找到它们与训练数据子集之间的对应关系。最后选择对训练数据子集分类效果最好的分类器对相应的聚类集进行分类测试。为了验证本文方法的有效性,采用大量UCI数据集进行实验,得到了较好的分类效果。
其他文献
针对水轮机调速器故障引发机组过速事故,介绍了PSWT型比例伺服数字微机调速器,事故的过程及处理,并详细分析了事故原因,提出防范对策.
ZigBee技术是一种新兴的无线通信技术,由于它本身的一些优越性,如低成本、低耗能、低速率、高安全等,使ZigBee技术一出现就等得到了诸多厂商的鼎力支持,所以发展非常迅速,在
火力发电厂以在锅炉燃煤为主要燃料,由于设计煤种和实际煤种有差距,现实中燃烧的有很多灰熔点低的煤种,特别容易结焦的煤种,这样给锅炉带来很不利的安全因素,危害机组的安全.
科技论文在线是一个论文快速发表与共享的知识平台,它面向的绝大部分用户来自各个科研单位的研究人员,通常有非常明确的知识领域,使用过程中具有很明确的目的。目前,科技论文在线
水下切割技术主要用在废弃桥桩、码头、水下管道、海难救捞和核污染结构件的水中解体.本文针对在进行海上风电建设时,导管架基础未能沉桩至设计要求标高的钢管桩进行水下切割
云冈盆地地处华北克拉通中北部,演化时期为早侏罗世晚期到晚白垩世,沉积较为连续.笔者对大同市新荣区助马堡村上白垩统助马堡组典型剖面进行了实测,并对沉积相进行了研究.研
与传统的报纸电视广告相比,网络广告有覆盖面广,观众数目庞大,传播范围广,方式灵活,互动性强等诸多优点。而且通过网络可以有效地对受众特点和广告投放效果进行更为准确的统计。传
对我国矿井辅助运输的几种常用系统,从技术性能,安全性,效能等方面进行了分析,重点讲述了单轨吊机车同其他设备的对比;在系统设备选型时可供借鉴.