基于海林格距离和SMOTE的多类不平衡学习算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wslin001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据不平衡现象在现实生活中普遍存在。在处理不平衡数据时,传统的机器学习算法难以达到令人满意的效果。少数类样本合成上采样技术(Synthetic Minority Oversampling Technique,SMOTE)是一种有效的方法,但在多类不平衡数据中,边界点分布错乱和类别分布不连续变得更加复杂,导致合成的样本点会侵入其他类别区域,造成数据过泛化。鉴于基于海林格距离的决策树已被证明对不平衡数据具有不敏感性,文中结合海林格距离和SMOTE,提出了一种基于海林格距离和SMOTE的上采样算法(Based
其他文献
体育产业法律环境是体育产业生存发展的土壤,体育产业法律环境将决定我国体育产业能否持续快速发展。但是,当下人们并没有充分认识到体育产业法律环境的重要性,这样必然会制
随着我国市场经济的发展和事业单位改革的神话,作为社会重要组成部分的事业单位财务管理方面出现不少问题。本文尝试对事业单位财务管理存在的问题进行分析,并结合实际探讨改善
移动号码携带(MNP)是改变电信业竞争结构、促进电信行业竞争的关键因素。MNP允许消费者在转移至另一移动电信服务供应商时,可以保留其原有的号码,MNP降低了客户的转移成本(switchi
国家助学贷款是对普通高校经济困难的学生资助的一项重大措施。本文从高校如何对国家助学贷款进行有效管理,促进国家助学贷款良性循环的角度进行分析和提出几点思考。
500家中欧客商汇聚一堂,120余项合作成果2小时内达成,350多家企业开辟合作新通道……进博会的魅力从进博会期间举办的中欧企业家大会上可见一斑。  在多领域拥有合作潜力  数据显示,中国连续14年是欧盟第二大贸易伙伴和第一大进口来源地。中欧在贸易、投资、基础设施、农业、金融、绿色经济、电子商务、第三方市场等领域具有巨大的合作潜力。  在11月6日举办的中欧企业家大会暨中欧企业对接磋商活动的开幕式