改进欠抽样方法及其在非平衡数据集分类中的应用

来源 :计算机工程 | 被引量 : 0次 | 上传用户:noonbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欠抽样方法在非平衡数据集分类时,未充分考虑数据分布变化对分类结果造成的影响。为此,提出一种基于聚类融合去冗余的改进欠抽样方法。采用聚类算法得到多数类样本高密度分布区域的聚类中心,将多数类样本划分为不同子集,通过计算各子集的相似度冗余系数对多数类样本进行去冗余删除,以达到欠抽样的目的。对15个不同平衡率的数据集欠抽样后,利用代价敏感混合属性多决策树模型进行分类。实验结果表明,在不降低非平衡数据集分类准确率的前提下,该方法能够提高少数类样本的正类率及预测模型的G-mean值。
其他文献
在特定的自然地理条件和人文历史发展的影响下形成的传统聚落对现代新农村景观规划有着重要的意义。会泽县娜姑镇白雾村传统聚落空间经历了千百年与自然环境的和谐共生,形成
随着时代的发展和进步,全媒体已成为当代最重要的网络格局。在其影响下,通过对高校新闻传播的特征以及影响的表述,明确高校新闻通讯员人才培养的重要性,并提出相应的措施,使
目的:探讨枯草杆菌二联活菌颗粒、蒙脱石散与茵栀黄口服液联合辅助治疗新生儿黄疸的临床疗效。方法:选取郑州市儿童医院2013年4月—2015年3月收治的新生儿黄疸92例,按随机数
目的评价microRNA-133(miR-133)对急性心肌梗死(AMI)的诊断效能。方法在PubMed、EMBASE、MEDLINE、Cochrane图书馆心脏专业数据库、中国生物医学文献数据库、中国学术期刊数据库(
目的 探讨RAS信号途径在干扰素-α(IFN-α)抑制大鼠血管平滑肌细胞(VSMCs)增殖中的作用.方法 应用转染IFI204 siRNA和/或IFN-α瞬时干预体外培养的大鼠VSMCs,以非特异性siRNA转染
新建地方高校在校园文化建设方面存在的主要问题有:校园文化价值取向具有较强的功利性、校园文化品位较低、校园文化建设投入不足、校园文化建设的封闭性,而造成这种状况的有
重力勘探主要是通过测量由地下密度不均匀体引起的重力异常来推断测区的地质构造或矿产分布情况等。重力数据通过整理、各项校正、异常分离等可以得到勘探目标的重力异常特征
法治意识是现代公民必备的基本素养。中学生法治教育是公民教育的重要内容。思想政治课是中学生法治教育的主要载体。思想政治课教师要充分发挥学科优势,挖掘教材中法治教育