一种新的基于信息熵的属性选择算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:AJ0704
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性选择是提高分类器性能的一种有效的方法.然而已有的属性选择算法要么假设数据无噪声,要么没有考虑属性间的交互作用,不能用于数据集中既有噪声又存在属性交互作用的情况.提出一种基于信息熵的属性选择算法,该算法用条件熵来评价属性子集对目标概念的描述能力,利用后向删除搜索策略进行属性选择.同时,根据不一致实例和关联规则中提升度的概念,给出噪声数据的定义和识别方法.该算法和典型的属性选择算法在10个UCI标准数据集上的对比实验结果表明,提出的算法在减少属性数量的同时将C4.5和NaiveBayes的平均分类精度分别提高了2.77%和3.42%.
其他文献
目的:探讨耳穴贴压对预防前列腺等离子切除(TUPKP)术后便秘的临床疗效.方法:选取TUPKP术后患者71例,随机分为两组,实验组36例,对照组35例.实验组在常规护理基础上加用耳穴压
实现农村土地正常、有序流转,是提高农业生产集约化程度和土地经营效益、稳定和发展农业生产的重要举措.为了解当前农村土地流转的整体状况,本文以南城县为例,对该县农村土地
烧变岩是煤层自燃引起周围围岩变质而形成的特殊类岩石.通过现场取样,在实验室对烧变岩试样进行了物理力学性质测试,试验结果表明:烧变岩的含水率略有降低,而力学强度普遍增
以房县深峪沟病险水库黏土心墙坝为研究对象,对其渗流稳定和坝坡稳定性进行评估,目的是为加固设计提供参考.设计了校核洪水位、设计洪水位、正常蓄水位的稳定渗流计算,校核洪
简要概述了桃源县的粮食生产现状,剖析了粮食生产中存在的主要问题,提出了稳定发展粮食生产的对策与建议.
提出了一种结合USFFT Curvelet变换的各向异性扩散图像去噪模型.它有机结合了Curvelet变换和各向异性扩散(P-M扩散)两者的优点.通过P-范数方法选择合适的梯度阈值K,P-M扩散过
针对建筑施工安全的常见问题提出主要对策.
膜污染是影响膜反应器发展的主要因素,因此,对膜清洗的研究有着重要意义.介绍了膜污染的影响因素,并探讨和研究了滤饼层和凝胶层清洗方法.
明渠干支流交汇口包含了许多重要的水流现象,在污水处理厂和过鱼建筑物等水利设施中经常遇到.本文采用k-ω紊流模型对90°明渠交汇口三维流场进行了模拟,运用双曲正切扩展函
介绍了高速公路景观设计的目的、方法和内容,从公路设计中的规划、线形、路面、防护工程、结构物、交通设施和绿化美化等方面,论述了设计中的景观问题.