数据分布不敏感的决策树算法

来源 :吉林大学学报(工学版) | 被引量 : 0次 | 上传用户:yttgfnm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低。已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合。由此提出了一种新的数据分布不敏感的决策树算法——DTID。该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度。DTID算法采用样本取模运算减少了算法的运行时间。实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果。
其他文献
利用统计软件,通过主成分分析获得昌九工业走廊26个县域的工业化指数,作为衡量地区工业化水平的标准。并通过空间分析软件研究2016年各县域工业化指数的空间关联性。研究结果
目的:研究豚鼠肝脏胆汁酸代谢经典途径关键酶--胆固醇7α-羟化酶(CYP7a1)和甾醇12αt-羟化酶(CYP8b1)的基因表达与胆汁脂质含量及胆固醇结石形成的关系.方法:采用点杂交技术
基于云南普洱茶市场面临的国内外环境状态,依据经济预警和农产品预警理论基础,以及指标优选原则,设计包括警情、警源和警兆的云南普洱茶市场价格预警指标体系,并以勐海沱茶的
近年,有关乳腺癌为全身性疾病已达共识,即使是Ⅰ期病例,也有近1/10会发生转移.以往根据病理类型、原发灶大小、腋淋巴结转移情况及雌激素受体测定等来筛选易复发或转移的高危
目的:介绍应用带蒂背阔肌皮瓣移植进行乳腺癌改良根治术后一期乳房再造的方法与疗效.方法:自2000年,用带蒂背阔肌皮瓣移植方法对中青年妇女乳腺癌改良根治术后行一期乳房再造
环孢素A(cyc losporine A,CsA)作为一种强效的免疫抑制剂,被广泛应用于脏器移植病人的免疫抑制治 疗[1].目前,有关CsA的药代动力学、药效学及药物相互作用等方面的研究资料已
20世纪医学和外科学最令人瞩目的进展是器官移植从幻想变成了现实。截止1997年底,全世界已有61万余人次的患者接受了各种不同类型的器官移植,移植的效果逐年提高,移植后出现了一
在茶文化体系元素传承发展过程中, 融入时代元素, 能够凸显传统茶文化元素的价值内涵, 同时整个茶文化元素中,融入了多样元素,从而实现了该文化体系传承发展的最佳效果.本文
我国茶文化与书画艺术尽管是两种全然不同的文化形态,但本质上都是以中华传统文化为营养,以古典哲学为核心,以传统美德为杠杆,在精神上高度契合。本文分别从创作主体、创作过
作为中华优秀传统文化重要组成部分的非物质文化遗产,是体现和彰显文化自信的重要载体和内容,新的历史时期,必须遵循自身发展规律,既要在坚守和传承中汲取营养,保持文化定力,也要在
报纸