新的基于代价敏感集成学习的非平衡数据集分类方法NIBoost

来源 :计算机应用 | 被引量 : 0次 | 上传用户:wawmq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中存在大量的非平衡数据,大多数传统的分类算法假定类分布平衡或者样本的错分代价相同,因此在对这些非平衡数据进行分类时会出现少数类样本错分的问题。针对上述问题,在代价敏感的理论基础上,提出了一种新的基于代价敏感集成学习的非平衡数据分类算法——NIBoost (New Imbalanced Boost)。首先,在每次迭代过程中利用过采样算法新增一定数目的少数类样本来对数据集进行平衡,在该新数据集上训练分类器;其次,使用该分类器对数据集进行分类,并得到各样本的预测类标及该分类器的分类错误率;最后,根据分类错误率和预测的类标计算该分类器的权重系数及各样本新的权重。实验采用决策树、朴素贝叶斯作为弱分类器算法,在UCI数据集上的实验结果表明,当以决策树作为基分类器时,与RareBoost算法相比,F-value最高提高了5.91个百分点、G-mean最高提高了7.44个百分点、AUC最高提高了4.38个百分点;故该新算法在处理非平衡数据分类问题上具有一定的优势。
其他文献
今年,我国农村金融经济发展逐渐出现金融需求的缺口不断集中、农村金融供给结构发生扭曲、农村信贷市场风险增加、农村生态环境脆弱等特点。国家对农村信用社支农高度的依赖
文字作为绝对主导性媒介的时代已经一去不复返,如今是图满天下的时代,可以说,整个世界就是一块大屏幕,我们每一个人都生活在图像的包围之中。在这个时代,成长中的孩子有了一个新的身份——“屏幕少年”。这是网络时代的趋势,不可逆转,也不必恐慌。  图像本来就是人类原初性的表达方式,在文字发明之前,人类就使用图像表情达意。从个体来看,我们每一个人也都是认识理解图像在前、掌握使用文字符号在后。图像作用于人的方式
期刊
总结28例冠状动脉旁路移植术后严重低心排综合征患者进行主动脉内球囊反搏的护理。认为护理重点是加强反搏管道的护理、反搏效果的观察和并发症护理干预。27例临床症状缓解,1
来势汹汹的新冠肺炎疫情,在众多“逆行者”的奋勇拼搏和全国人民的共同努力下,已经渐趋平静,中国的抗疫斗争取得了阶段性胜利。现在,全国各地的疫情防控措施逐渐常态化,各行各业复工复产情况稳定向好,各级各类学校都在有计划、分年级地尝试开学复课。这次突如其来的疫情犹如一次“大考”,广大中小学按照教育部“停课不停教、停课不停学”的要求,利用互联网,积极开展线上教学,普及防疫知识,弘扬抗疫精神,凸显了制度优势,
<正>城市里的坏天气和最近阴晴不定的坏心情让我特别需要逃离。雁荡山,刚刚好。从杭州出发两小时动车南下,说走就走。城市里的坏天气和最近阴晴不定的坏心情让我特别需要逃离
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
马克思主义唯物史观及其实践性决定了马克思主义文学批评的现实品格,对这一论断的深刻性理解要置于时代文化语境中。其有效性不仅要与中国文学实践相结合,更要与当前的文化现