基于聚类权重分阶段的SVM解不平衡数据集分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hudaye1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SVM在处理不平衡数据分类问题(class imbalance problem)时,其分类结果常倾向于多数类。为此,综合考虑类间不平衡和类内不平衡,提出一种基于聚类权重的分阶段支持向量机(WSVM)。预处理时,采用K均值算法得到多数类中各样本的权重。分类时,第一阶段根据权重选出多数类内各簇边界区域的与少数类数目相等的样本;第二阶段对选取的样本和少数类样本进行初始分类;第三阶段用多数类中未选取的样本对初始分类器进行优化调整,当满足停止条件时,得到最终分类器。通过对UCI数据集的大量实验表明,WSVM在少数类
其他文献
巴音高勒铅锌多金属矿处于乌力吉-欧布拉格铜、金成矿带上,区域矿产资源较丰富。矿区内热液活动较强,构造断裂发育,地层及岩浆岩接触带附近蚀变较强,具有矽卡岩特征,物化探异
研究非自治n维Duffing系统周期解的存在性问题.在具有部分周期位势和次线性非线性项时,将这类系统的周期解转化为定义在一个适当空间上泛涵的临界点,然后利用临界点理论建立了此
我县的新闻宣传工作,历来得到了县领导的高度重视,始终把新闻报道工作列入了宣传思想工作的重要日程,在财政较为困难的情况下,每年设置新闻宣传专项奖励经费2万元。同时,确定
搜索引擎的索引库内容更新存在一定周期,目前在提供We b页面搜索服务时,搜索结果的排序没有考虑其索引资源的实时质量特征,难以满足用户搜索的多层次要求。提出了用户搜索体验质
不等维多元复欧式空间中单位球间的逆紧全纯映照问题是多元复分析研究领域的传统与经典问题,至今,仍有丰富的内容尚待研究.本文构造了一族二维单位球到四维单位球间的逆紧全
研制了一种基于无线技术的液压油泵测试装置,该装置能够在不拆卸液压设备且不影响液压油泵正常工作的情况下,对液压油泵在正常运行过程中的工作状态进行实时监测,确保液压油
针对采用PID控制方式的自动核子皮带秤存在最佳PID参数难以确定、过冲震荡、控制精度差的缺点,研究基于核子皮带秤的物料流量精确控制的方法。利用物质对γ射线吸收的物理关
论坛和博客等社交媒体中的数据,能够充分反映社交网络用户的思想行为动机,为了分析这些数据,挖掘用户的一些行为动机,提出一种基于内容相似性的社交网络用户行为倾向性分析方
在流水式量热计中温度传感器无法实时地反映流水温度变化,为了达到准确测量能量的目的,必须保证对应的温度积分值基本不受传感器响应时间的影响。为此建立了温度传感器的热模型
《重庆市志·报业志》是一部重庆新闻业的百科全书,研究重庆二十世纪新闻史者不可不珍贵此书。我曾在中华人民共和国建国之初在重庆新闻界工作过5年(1949—1954),我那时