一种新的近邻密度SVM不平衡数据集分类算法

来源 :贵州大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hebehehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。
其他文献
饲用植酸酶酶活性的定量分析至今没有普遍公认的检测方法,本测定方法是在BASF公司1991提出的植酸酶活性的测定方法的基础上进行研究改进,建立了更适合于普通实验室条件下植酸酶
本文基于多类型复发事件数据,提出了一类半参数变换模型,该模型包含了一些重要的半参数模型。利用广义估计方程的思想,对模型中未知参数和非参数函数进行了估计,并证明了估计
专家观点:上海财经大学金融学院院长戴国强:以往中国企业的“走出去”,往往出现两种扭曲的形式:一种是贱卖,国内能卖30美金的衬衫,到了国外只卖5美金,自跌身价,只是为了打出
首先以单硬币量子博弈理论为基础,结合经典同或门的逻辑关系,研究并给出量子同或门的定义;据此进一步利用单硬币量子博弈模型,提出了实现量子同或逻辑关系的理论方案,并将量
本文将2维圆形颗粒间的滚动阻力模型推广到非圆形颗粒体系,用于模拟准静态剪切实验,得到了满足率无关和客观性的剪切、剪胀曲线。给出的滚动阻力模型对Hertz接触模型和线性接
学生成绩是教学评估的一项重要衡量指标,考虑学生考试成绩特点提出了一种基于试卷难度系数变化的GM(1,1)修正模型,并运用此模型对花溪一中考试成绩进行预测,实践证明该修正模型