基于不平衡数据集的改进随机森林算法研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:adiwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机森林算法在多种应用场景与数据集中都实现了良好的模型分类效果,但该算法在应用于不平衡二分类数据集时,受限于样本数据量本身的好坏比倾斜与决策子树叶节点投票机制,对样本量占相对少数的小类属样本不能很好地对分类进行表决。对此,文中对原有随机森林算法的节点分类规则进行改进。在模型训练过程中,综合考虑度量节点样本分类占比与节点深度,增加有利于少量类样本分类信息,从而提高了少数样本类的分类准确率。通过在不同数据集上进行随机森林改进算法的效果测试,证明改进算法相对于传统算法在不平衡数据集上有更好的模型表现,大样本条件
其他文献
目的观察脑组织氧分压(PbtO2)联合颅内压(ICP)监测用于指导重型颅脑损伤治疗的应用价值。方法将68例重型颅脑损伤患者按照随机数字表法分为两组,对照组给予ICP监测,研究组给
国家构建成为近年来学界研究的热点,因此有必要对国家构建理论进行梳理,依据国家构建理论和中国自身的国家历史和制度逻辑,将国家官僚体制、国家能力、政权合法性和社会成长这四
《上海赋》对老上海的历史、人物、风情等的描摹,体现了木心独特的现实主义手法。“典型环境中的典型人物”“细节的真实”等都可以从木心所刻画的一个个活灵活现的上海人,以
道教素来"重人贵生"、追求"长生久视",所以对疾病的预防特别重视.本文仅就武当道教医药避瘟疫方药介绍如下.
熔铜炉炉膛内凝铜的产生原因及其处理哈尔滨电缆厂王清业主题词:浸涂法连续铸杆机组,熔钢炉,凝铜,处理浸涂成型无氧铜杆生产线中的熔钢炉,是采用工频感应加热组合炉。这种熔铜炉的
监护制度是一项重要的民事法律制度,其主要目的在于保护被监护人的合法权益.我国1986年问世的<民法通则>内容过于简单、抽象,监护制度亦存在着不少缺陷,这既不利于我国民事法
20世纪90年代以来,受信息技术和网络发展的推动,世界经济出现了由工业社会向信息社会转变的新局面,信息技术与网络在经济发展中的地位和作用也日渐突出.经济学中也开始把信息
具有创新思想和创新精神是创新型人才的基本内涵。应在课程教学和考核中穿插团队协作精神,以利于人才创新素质的提高。构建培养创新型人才的教学模式应包括理论依据、教学目
地区价值链和全球价值链分工已经成为一种普遍现象。文章从价值链长度和位置、中国和日本在东亚主要经济体出口的国外增加值中的比重角度,对中国和日本在东亚价值链中的地位
目的:探讨增力再生丸联合血脂康胶囊对心肝火旺型中风先兆证患者继发中风的预防效果和临床价值。方法:选取心肝火旺型中风先兆证患者52例,根据门诊结果分为对照组和观察组,每