不平衡数据分类研究及其应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：HongJuZhang

【摘要】

：

针对传统机器学习算法对于不平衡数据少数类的分类精度较低的问题。分析了造成该问题的原因，进而提出一种欠抽样数据处理方法，提高少数类分类精度。该方法通过k-means算法对样

【作者】

：

叶枫丁锋

【机构】

：

浙江工业大学经贸管理学院

【出处】

：

计算机应用与软件

【发表日期】

：

2018年1期

【关键词】

：

不平衡数据 k-means聚类召回率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对传统机器学习算法对于不平衡数据少数类的分类精度较低的问题。分析了造成该问题的原因，进而提出一种欠抽样数据处理方法，提高少数类分类精度。该方法通过k-means算法对样本进行多次聚类，删除多数类的噪声以及多数类与少数类重叠度较高的样本。同时引入删除因子A，降低多数类丢失特性的风险。通过对UCI数据集的实验分析，经该方法处理，分类算法对少数类的召回率和F值均有提高，证明该方法能有效提高少数类的分类精度。最后将方法应用于预测肺癌患者的术后预期寿命，患者一年期死亡率的召回率和F值分别提高42％和23％。

其他文献

走近他们讲述荣誉背后的故事——记天津市2006年度“五一”劳动奖状先进集体、武清区规划和国土资源局驻行政许可中心窗口

翻开2006年度天津市“五一”劳动奖章、“五一”劳动奖状获得者的荣誉册，武清区规划和国土资源局驻行政许可中心窗口的名字跃然纸上。作为一个负责全区规划国土管理的重要职能

期刊

“五一”劳动奖章行政许可事项国土资源局先进集体天津市武清区规划奖状

诚信为本造福社会——2006年度天津市劳动模范、天津三延精密机械有限公司副总经理韩伟光

韩伟光,女,53岁,中共党员,经济师,现任中韩合资天津三延精密机械有限公司副总经理。具体的负责公司的管理工作。

期刊

副总经理精密机械天津市诚信为本劳动模范公司韩伟有限

学校始于树下

在刚刚过去的春节假期我去了印度,首站就到了菩提伽耶,目的是去看那棵著名的菩提树。2500年前释迦牟尼在经过数年的苦修之后来到一棵菩提树下静坐悟道,49天后顿悟成佛,这棵树

期刊