一种针对类别不平衡的代价敏感集成算法

来源 :山东理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:limanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中的数据挖掘经常涉及从类别分布不平衡的数据集学习,少数类的数量相比于其他类较少.从包含少数类的数据集中学习,通常会产生偏向于多数类的预测分类器,但对少数类的预测精度较差.针对少数类学习提出一种新的集成算法Cost-SMOTEBoost,该算法是SMOTE算法和AdaCost算法的结合.通过实验表明,Cost-SMOTEBoost算法在不降低精确率的情况下提高了召回率,从而提高了在分布不平衡数据集上的表现.
其他文献
随着社会主义市场经济的不断发展,我国种植业得到快速发展,尤其是杂交榛子品种改良方面,关于杂交榛子品种及栽培技术措施已经成为社会各界和相关学者关注的话题。榛子是世界
利用改进的Rose釜,测定了95.8kPa下甲酸乙酯-乙醇二元体系的汽液相平衡数据.用面积检验法对所测得的实验数据进行了热力学一致性检验.采用Wilson模型和NRTL模型进行了关联,得
农业已进入新的发展阶段,种子作为农业结构调整的科技动力,关系到农业结构调整,农民增收的大局。方玉1号经选育、试验,其特征特性符合粮饲两用,为镰刀弯地区与北方农牧交错带
农田水利工程中应用节水灌溉技术,对农业现代化发展与水资源合理利用具有重要作用。节水灌溉技术也是农业进步发展的必然趋势,是生态环境保护的主要途径。对此,根据实践研究,
在准扭转码的指标l与有限域Fq的扩张次数L互素的情况下,给出了有限域上任意长度的具有相同校验多项式的不同1-生成元准扭转码的计数公式.通过建立集合之间的双射,间接地解决
针对配电网中经消弧线圈接地系统的小电流接地故障定位困难这一问题,利用接地点上游与下游间暂态零模电流相似性的原理,在现有相关系数法的基础上提出一种改进的判断故障点范
克服了Musielak-Orlicz-Sobolev空间的结构复杂性,吸取了Musielak-Orlicz空间中凸性的研究方法,给出并证明了赋Luxemburg范数的Musielak-Orlicz-Sobolev空间具有严格凸性的充
首先分析了互助县农机化技术推广发展现状及面临的新形势;然后谈了一些农机化技术推广新形式、新方法。
在水稻种植中,良好品种的选择十分重要,在产量提升、质量保障方面具有重要的作用。荃优822是安徽省皖农种业有限公司和安徽荃银高科种业股份有限公司用不育系“荃9311A”与恢
主要研究环R=F2+vF2+v^2F2上线性码的深度分布及其深度谱,其中v3=v.基于在环R上的线性码与它们的生成矩阵研究,可以获得在有限域F2上的线性码C1,Cv,Cv2与它们的生成矩阵.利用线