【摘 要】
:
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于近邻密度改进的SVM(NDSVM)不平衡数据集分类算法.该算法先计算多数类内每个样本的近邻密度值,然后依据该密度值选出
【基金项目】
:
2015年甘肃省高等学校科研项目(2015B-132)
论文部分内容阅读
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于近邻密度改进的SVM(NDSVM)不平衡数据集分类算法.该算法先计算多数类内每个样本的近邻密度值,然后依据该密度值选出多数类中位于边界区域、靠近边界区域的与少数类数目相等的样本分别与少数类完成SVM初始分类,最后用所得的支持向量机和剩余的多数类样本完成初始分类器迭代优化.人工数据集和UCI数据集的实验结果表明,与WSVM、ALSMOTE-SVM和基本SVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.
其他文献
1中国橡胶工业中国在2001年成为世界天然橡胶(NR)第一消耗大国之后,2002年耗胶总量又跃世界第一.据估计,2002年中国天然橡胶消耗量为131万t,占世界天然橡胶总消耗量的17%,合
研究初始时处于纠缠态的两个宏观场各自独立地与一个原子相互作用的系统的动力学特性,结果表明:当原子与场的作用时间t=(2n+1)πn1/2/g时,两个腔场间的纠缠将完全消失,即出现纠缠
通过使用代数曲线论中的Bezout定理,给出了构造二元分次插值适定结点组的新的构造方法——添加直线法和添加圆锥曲线法,所得结论推广了文献[1](朱平,傅凯新.十字型结点组及R^2上的
目的:通过检测新入伍女兵集训期间心理弹性状况变化情况并分析其影响因素,为针对女兵开展科学训练提供理论依据。方法:选择某部队2013-2014年入伍的240名新入伍女兵作为研究对象
临床实习是护士教育的重要阶段,是护生将理论知识转化为实践操作的关键环节,是步入护士职业的基础阶段。如何把护生培养成为医德良好、技术过硬、理论扎实的护理人,是护理管理者