一种可用于分类型属性数据的多变量决策树算法

来源 :东北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:swb39274355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁
其他文献
CPU体温哪里看  CPU是电脑配件里最重要同时也是“火气”最大的成员,尤其是那些早期架构或者超频使用的CPU。运行起来的温度是非常高的,用户稍有不慎就有可能烧掉CPU。因此,各种各样的CPU温度监控方法以及五花八门的降温软件也应运而生。
语文在我国教学中属于基础性学科,在教学过程中,语文教学应注重学生综合能力的培养,尤其是学生的理解能力和鉴赏能力,因此,在教学中应不断变换教学方法,丰富课堂形式。根据新课改要
目的 探讨中药颗粒剂与饮片用于治疗风热感冒的临床疗效。方法选取2010年8月-2011年8月就诊的风热感冒患者46例,随机分为观察组和对照组各25例,其中观察组给予忍冬感冒颗粒,对照
制造业是我国的支柱产业,其自主创新关系着国计民生,制造业自主创新也是建设创新型国家的首要任务。外商直接投资的进入为我国带来了机遇与挑战。我国企业既要学习模仿,又不能照
中考复习紧扣《课标》和《考试说明》,注重基础,回归教材,帮助学生建构生物学的知识结构和知识体系,关注生活,学以致用,注重对学生能力的培养,关注学生的情感态度和价值观。