基于粗糙集理论与CAIM准则的C4.5改进算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:liongliong588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
C4.5算法是一种非常有影响力的决策树生成算法,但该方法生成的决策树分类精度不高,分支较多,规模较大.针对C4.5算法存在的上述问题,本文提出了一种基于粗糙集理论与CAIM准则的C4.5改进算法.该算法采用基于CAIM准则的离散化方法对连续属性进行处理,使离散化过程中的信息丢失程度降低,提高分类精度.对离散化后的样本用基于粗糙集理论的属性约简方法进行属性约简,剔除冗余属性,减小生成的决策树规模.通过实验验证,该算法可以有效提高C4.5算法生成的决策树分类精度,降低决策树的规模.
其他文献
<正>Brain tumors are devastating diseases that occur when resident brain cells are transformed.As most other solid tumors,brain tumors are classified as either
<正>Glioma represents the most common primary tumor in the central nervous system(CNS).Along with the increased incidence of brain tumors,there was a 194%increa
<正>Nowadays,with the development of science and technology,the specialization of clinical medicine and refinement of treatment demand more accurate diagnoses,w
EAST放电实验会产生大量的实验数据,为了满足实验人员高效地获取实验数据、了解实验进展的需求,提出了基于Openfire+Spark框架的EAST即时通信系统解决方案.该系统具有状态呈现