论文部分内容阅读
在现实生活中,数据集分类常遇到数据不平衡问题,就是某一类的样本数比其他类的样本数明显少.在二分类数据中,样本数多的数据集称为正类,样本数少的数据集称为负类.为了提高算法在不平衡数据集下的分类性能,提出使用SWOTE算法,得到新的数据集.通过对比新数据集和原不平衡数据集在BLR(二项逻辑斯蒂回归)算法中的分类效果,结果表明本文SWOTE-BLR算法的分类效果得到明显提升.