一种基于SMOTE的不均衡样本KNN分类方法

来源 :广西科学 | 被引量 : 0次 | 上传用户:flexhansen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练集均衡化,并训练逻辑回归模型;然后使用逻辑回归模型对训练集进行预测,获取预测为正样本的数据,通过使用SMOTE方法均衡化该正样本,并训练KNN模型;最后把测试集放入该结合逻辑回归方法的KNN模型进行预测,得到最终的预测结果。围绕6个不均衡数据集,
其他文献
总结了清8改汊前后的水沙变化及特点,分析了新口门附近不同等深线的冲淤变化和拦门沙纵断剖面冲淤变化的特征,认为:①清8改汊后,来水来沙不平衡,水沙集中在汛期8、9两个月的1
目的探讨转变体位护理在新生儿肺炎患儿临床治疗中的应用效果。方法选择2017年4月至2018年10月本院收治的新生儿肺炎患儿72例,使用随机数表法将所有患儿分为两组,各36例。对照组予以常规体位护理,观察组实施转变体位护理,比较两组患儿生命体征、各症状持续时间及住院时间、智能发育情况、临床疗效及复发率。结果护理后,观察组HR、R分别为(127.36±5.84)次/min、(40.17±3.52)次/
余光中是中国新文学精神新质建构的引路者与中国新文艺质素生发的探寻者。他关于"西化"与"现代化"概念特质的自觉界定及其理论外射的时代价值和内含智慧,在当下应有所肯定。
目的通过分析宫颈鳞状上皮内病变在阴道镜下的异常图像表现,并通过活检后病理诊断结果证实进行分析。方法选择36例阴道镜下醋酸反应异常和碘试验阴性的病例有针对性进行活检。结果检出宫颈疾病32例,包括低级别病变6例,高级别病变26例,宫颈原位癌1例。结论阴道镜指导下进行活检,可明显提高诊断的阳性率,减少临床上误诊和漏诊的发生,为宫颈疾病的早期干预提供了可靠、方便的诊断依据,同时也减少患者不必要的活检。
针对近年来我国条斑紫菜(Pyropia yezoensis)栽培区北移、产区扩大、紫菜交易市场出现不同原藻产地干紫菜混杂的现象,迫切需要对不同原藻产地的干紫菜进行鉴别。本文采用色差
PSI-200粒度仪在德兴铜矿大山选矿厂对旋流器的溢流粒度进行在线检测,对选矿生产具有重大的指导作用.该仪器采用直接测量的方法,用PLC处理数据,使仪器具有无可比拟的优越性,
宁夏引黄灌区水资源利用存在的问题是:①灌溉水有效利用率低;②排水不畅、地下水位偏高,造成土壤盐渍化严重,中低产田面积大;③水价低于供水成本,不利于节约用水;④水资源污
目的观察评价2型糖尿病(T2DM)合并高血压(EH)患者血脂(BL)、血糖(BS)代谢情况与高血压(EH)病程的关系,为临床T2DM合并EH患者治疗提供科学依据。方法选取2017年3月至2019年8月期间本院收治的T2DM合并EH患者103例,按照DM病程与EH病程长短分为:观察A组55例患者是DM早于EH;观察B组48例是EH早于DM;再选取同期收治的单纯T2DM患者53例作为对照组。并分析三组
利用基于密度泛函理论的第一性原理方法对Ca5Zn3化合物的晶格常数、形成焓、弹性常数、以及电子态密度等进行计算研究。为了获得Ca5Zn3化合物的结构稳定性,考虑了Cr5B3、W5Si