基于代价敏感的随机森林不平衡数据分类算法

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:zhouqin1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机森林在分类不平衡数据时 , 容易偏向多数类而忽略少数类.可以将代价敏感用于分类器的训练; 但在传统代价 敏感随机森林算法中, 代价函数没有考虑样本集实际分布与特征权重, 且在随机森林投票阶段, 没有考虑基分类器的性能差 异.提出一种改进的代价敏感随机森林算法IC SR F, 该算法首先根据不平衡数据集的实际分布构造代价函数; 并将权重距离 引入代价函数, 然后根据基分类器的性能采取权重投票, 提高分类准确率.实验结果表明, IC S R F算法能有效提高少数类的分类性能,可以较好地处理不平衡数据.
其他文献
与遗传因素有关的变异可能影响运动才能,影响由遗传决定的肤纹性状,故运动才能与肤纹性状有关。介绍了肤纹性状与运动天赋、智力、运动素质关系的研究成果及运动员肤纹学特征的
为探讨中草药饲料添加剂对黄羽肉鸡种鸡产蛋性能的影响,选择30周龄健康黄羽肉鸡2484只,随机分为对照组和试验组,每组2个重复。对照组饲喂基础饲粮,试验组从正试期开始饲喂基础饲
组织好一次生动活泼的现场会议并不是一件容易的事,那么,该如何开好现场会呢?  选出亮点,忌“相貌平平”。会议决定在哪里召开、参观哪个地方,既是上级对该地工作的肯定,同时又是向各级领导、各位同行宣传展示本地形象的好机会。因此,一定要根据会议主题,严格把关,把最具代表性的点选出来,让大家眼前一亮、耳目一新。当然,绝不能弄虚作假,更不能劳民伤财搞所谓的“面子工程”“形象工程”。  查看路线,忌“怨声载道
联合国儿童基金会《中国儿童发展指标图集(2014)》最新数据显示,随着经济的发展,我国已在多项与儿童有关的发展指标方面取得显著进展,提前完成贫困人口减半、普及初等教育、降低儿
欧美的环保意识和环保工作一向走在世界前列,对印刷业而言也不例外。他们严格的法律法规、完善的环境管理、灵活的经济措施、先进的技术手段以及从政府到企业的广泛参与,其经
为替代扩散—合金化粉末,研制了巧妙设计的粘结剂处理的预混合粉。一类粘结剂处理的材料,符合MPIF标准35“粉末冶金结构零件材料标准”中扩散—合金化材料的化学组成范围。另一
为了研究饲料添加剂一益康XP对肉种鸡产蛋性能及蛋品质的影响。试验饲粮分为2个处理,处理一不添加益康XP,处理二添加益康XP5mg/kg,每个处理4个重复,每个重复25只公鸡、500只母鸡,预
佟二堡新市镇隶属辽阳灯塔市,正县级建制,区域面积988平方公里,下辖18个行政村、两个社区。常住人口4.3万人,流动人口2.5万人。镇党工委下设44个党(总)支部,1609名党员。
通过对女子七项全能运动现有水平的实质性研究,发现加速全国女子全能运动发展的有效途径在于:结合国情,既要缩短在跑、跳项目上与世界水平的差距,更要发挥投掷项目在国内(乃
觜黧树镇位于昌图县东北部,辖14个行政村、1个社区,2.45万人口。下辖党支部19个,共有党员695名。2016年被中共辽宁省委授予“辽宁省先进基层党组织”称号。党日活动主题化,组织建