【摘 要】
:
集成学习由于泛化能力强,被广泛应用于信息检索、图像处理、生物学等类别不平衡的场景。为了提高算法在不平衡数据上的分类效果,文中提出一种基于采样平衡和特征选择的集成学
【机 构】
:
华东理工大学化工过程先进控制和优化技术教育部重点实验室
论文部分内容阅读
集成学习由于泛化能力强,被广泛应用于信息检索、图像处理、生物学等类别不平衡的场景。为了提高算法在不平衡数据上的分类效果,文中提出一种基于采样平衡和特征选择的集成学习算法OBPD-EFSBoost。该算法主要包括3个步骤:首先,依据少数类高斯混合分布得到的概率模型,进行过采样构造平衡数集,扩大少数类的潜在决策域;其次,每轮训练个体分类器时,根据上一轮的错分样本综合考虑样本和特征的加权,过滤冗余噪声特征;最后,通过个体分类器的加权投票得到最终的集成分类器。8组UCI数据分类结果表明,该算法不仅有效提高了少数类
其他文献
利用“沪港通”政策实施这一外生冲击,本文研究我国资本市场开放对公司投资效率的影响。研究发现,对比控制组公司,“沪港通”政策的实施可有效提高公司投资效率。检验影响机
方音对学习英语的影响是一种特殊的母语迁移。依据实验语音学的方法,对海南大学30名2009级非英语专业新生进行英语短文朗读录音,利用Cool-edit语音处理软件及Praat语音分析软件
按照常用铺面结构类型,并结合武汉铁路集装箱中心站箱场及道路铺面设计特点、主要原则及主箱区铺面设计要求,分析论述了混凝土铺面的结构、设计参数、流程,以及铁路集装箱站
实际生产过程中,系统受到环境的影响而产生参数漂移,传统的PID控制算法应用受限.自适应控制应运而生并显示了其强大的控制优势.其中,模型参考自适应控制因其历史最为久远,应
对杂交晚稻的产量及其构成因素进行了相关分析和通径分析,结果表明,结实率与产量间呈极显著的相关,是影响产量的主要因素.高产栽培策略是:在协调穗粒结构的基础上,加强中后期
桩底后注浆施工技术是现代超高层建筑桩基工程中常用的施工技术,能够有效的提高超高层建筑桩基的承载能力,规避超高层建筑出现沉降现象的重要措施,有效的提升超高层建筑的服
对低碳技术创新系统能力评价,可以有效了解区域低碳技术创新的实际情况.发现问题和不足,为提出低碳技术创新的有效措施提供决策参考。本文通过构建指标体系,采取层次分析方法来确