基于非平衡数据的随机森林分类算法改进

来源 :重庆大学学报 | 被引量 : 0次 | 上传用户:eaglesword
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机森林算法作为一种组合分类器有较好的分类性能,适合多样的分类环境。算法同样也存在一些缺陷,例如算法处理非平衡数据时不能很好地区分正类和负类。针对这一问题,通过对抽样结果增加约束条件来改进Bootstrap重抽样方法,减少抽样对非平衡性的影响,同时尽量保证算法的随机性。之后利用生成数据的非平衡系数给每棵决策树进行加权处理,提升对非平衡数据敏感的决策树在投票环节的话语权,从而提升整体算法对非平衡数据的分类性能。通过上述两种改进可以明显提高随机森林在决策树数量不足情况下的分类精度。
其他文献
玉石是天地灵气的结晶,也是大自然的光辉成就。玉雕以其精细为世人所赞誉,众多的玉石雕刻技艺百花齐放,各有千秋。雕刻技艺中的调水是一门严谨而又复杂的技术,能很大程度上提
精密制冷解决方案的核心是精密空调机,精密空调机可以有效地解决计算机设备的热交换问题。但是,在现代数据大集中的网络化时代,计算机小型化、机柜化,而服务器趋向薄型化、刀片化
体外受精-胚胎移植技术是目前被广泛应用于不孕不育患者的一种助孕技术。对接受体外受精-胚胎移植治疗者及其配偶进行有针对性的心理干预有利于减轻其负性情绪,改善妊娠结局。本文对国内外进行体外受精-胚胎移植治疗者及配偶的负性情绪及心理干预研究现状进行综述,为日后临床工作者建立系统完善的心理干预模式提供新的思路和参考。
新浪微博在我们日常生活的信息传播中起到了重要的作用,截止2014年新浪微博的每日活跃人数已经达到了6660万。而新浪微博公共平台一般拥有过万的粉丝数,他们的影响力及其大,
空气源热泵供暖技术是一种全新供暖技术,主要运用在冬季较为寒冷的地区,能够有效改善传统供暖中存在的不足,为寒冷地区居民提供舒适生活环境。基于对空气源热泵供暖技术运用
师:小朋友们,看到大家水灵灵的眼睛,红彤彤的脸蛋,我想,咱们班的孩子一定都很聪明!刘老师想写一个汉字,考考大家,好不好?
随着计算机应用的发展,对供它可靠性的要求越来越高,可靠的供它是业务稳定运行的必要条件之一。而某银行清算中心由于历史的原因,UPS使用多年已显陈旧,且担负着重要任务。受设备
通过对发电厂UPS三种配置方案的分析比较,提出了UPS各种配置的特点和优化方案,同时具体阐述了UPS维护保养要点。
全国人大常委会《关于司法鉴定管理问题的决定》实施之后,公安机关"自侦自鉴"的问题并没有解决,其鉴定活动的独立性与公正性仍然受到质疑。反思我国的公安司法鉴定体制,确实存
近年来,学习分析技术发展迅速,并引起了专家学者及广大一线教师的关注。为全面了解和把握我国学习分析技术的研究现状,以2012—2015年CNKI收录的67篇学习分析技术文献为研究