一种面向非均衡分类的随机森林算法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:sc13859315118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机森林算法是一种简单、有效的集成学习算法。它通过自助法和随机化特征子集的方式增加了集成分类的多样性,进而构建出比Bagging和Boosting更精确的集成分类器。然而,当面对非均衡分类问题时,其建树所使用采用的分裂指标——Gini指数被证明对类分布敏感,这在一定程度上降低了随机森林的分类精度。本文提出一种使用K-L距离作为分裂指标的随机森林。实验采用ROC曲线下面积(AUC)作为分类性能评价指标,通过在低度非均衡数据集和高度非均衡数据集上分别与随机森林、平衡随机森林以及基于Hellinger决策树的B
其他文献
为了研究组合振动筛的振动特性和运动参数匹配,用Solidworks建立组合振动筛三维模型,并用AD?AMS进行运动学仿真分析。通过对GDZS2460/2型上、下单元组合振动筛虚拟设计与仿真
目的:通过放射生物学模型分析和剂量学比较为早期鼻咽癌放疗剂量分割方案的优化选择提供参考。方法:选取24个病例,采用3种剂量分割方案(总剂量均为70 Gy,分割数分别为30、33
<正> 劳动用工制度是现代企业制度的重要组成部分。本文在对美日两国企业劳动用工制度进行比较研究的基础上,提出一种新模型:差别序列结构,并论述这一构想的可行性。一、长期
目前,多种类型的纳米载体已被广泛用于化疗药物的靶向传递和控制释放,但在促进抗肿瘤药物在病灶部位的累积、降低其在正常组织的过早释放仍然面临着挑战。前期研究中,采用二
以线热源法为基础,阐述基于分布式光纤传感技术的岩土体导热系数测量方法的基本原理。详细介绍测量的基本过程、方法和仪器设备。设计试验模型,对不同含水量情况下的3种岩土体
腐殖酸具有明显的还原能力,与环境中金属、有机物的氧化还原反应密切相关。腐殖酸的氧化还原特性是由于醌、酚等官能团的存在,尤其是醌基团在电子传递中起到了重要的作用,还
<正>杭州市政府在2015年即制定了《杭州市加快推进城市国际化行动纲要(2015—2017年)》,着力实施城市国际化工程,以国际视野加快推动城市功能国际化进程。其中建设国际人才社
地方电视媒体面对高层级媒体的竞争,其在发展的过程中必须突出自身的优势,才能在竞争中获得自身的发展。本文从地方电视媒体发挥自身优势,与高层级媒体间实现差异化;以及地方
主要探讨了微电子机械系统中普遍存在的失效模式及机理,对几种没有明确对应模式的失效机理也做了介绍。最后针对一种具体的微机械开关器件,研究了它的可靠性问题,给出了相应的可
课堂教学延伸是课堂教学的重要环节,《历史与社会》的课堂延伸应该走出追求形式、猎奇求异、没有关联的延伸等误区;做到与乡土资源交融、与社会生活交融、与第二课堂交融,使