集成学习及其应用研究

来源 :石家庄经济学院 | 被引量 : 6次 | 上传用户:info1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习(Ensemble Learning)是一种机器学习范式,是当前的研究热点之一在多个领域有了很好的应用。但集成学习技术还没有成熟,在研究过程中仍然存在着众多待解决的问题,在应用上也和人们期待的水平相去甚远。本课题对集成学习进行了深入地研究,一方面分析了现有方法的优劣。另一方面,研究了影响集成效果的各个因素,这为进一步改进集成学习做好铺垫。在现有算法的研究基础上,提出了新的集成学习方法:针对某些个体分类器对集成效果起较小的作用或起消极作用的情况,本文提出了“基于信息增益的分类器选择”方法,这种方法首先需要构造分类器空间,然后计算个体分类器信息增益,根据信息增益删除一个或若干个个体分类器,最后再将剩余的分类器集成,实验结果表明经过信息增益选择分类器后的集成要优于不进行处理的情况;针对数据集中不是所有的特征都对集成起积极作用的情况,本文提出了“基于改进遗传算法的特征选择”方法,该方法将机器学习应用到遗传算法中,达到有效选择特征的目的,然后在处理过的数据集上使用集成学习,实验证明经过此方法处理的数据集不但在集成效果有了很大提高,而且大大缩短训练时间。最后,本文还对集成学习的应用进行了研究,第一,详细分析了入侵检测数据集(KDD CUP99、UCI)。第二,对KDD CUP 99做了适当的处理,然后成功将集成学习方法应用到此数据集上。第三,比较了经典的集成学习方法和本文提出的集成学习方法在入侵检测数据集上的效果。本文通过多次实验和应用实例对提出的新方法进行了验证,结果表明新方法是有效性的、可行性的。
其他文献
随着模式识别和人工智能的高速发展,多目标图像检测技术得到国内外社会各界的广泛的关注和深入研究。图像检测识别在科技领域和安全领域方面上都具有很强大的发展前景和广大的
学位
期刊
随着计算机网络技术的不断发展,办公信息系统在企业中被广泛使用,系统的权限问题受到越来越多的关注。如何让合法的用户访问到需要的资源,而非法用户受到限制,保护企业信息的安全
线性时变结构的工作模态参数识别在振动控制和故障诊断等领域具有重要的理论意义和工程应用价值。本文基于线性时变结构的“时间冻结”和“瞬态”表示,提出了自适应主元分析的线性时变结构工作模态参数在线识别方法,并进行了理论推导和数值仿真验证。主要工作如下:(1)从基本主成分分析(PCA)算法出发,建立其与线性时不变结构位移响应的模态坐标表示之间的对应关系,阐述了基于PCA工作模态参数识别方法各参数物理意义及
目的:探讨外泌体相关RNA结合蛋白在肝细胞癌(HCC)中的可能功能.方法:对肿瘤微环境(TM)和生理微环境(PM)组织进行RNA测序(RNA-seq)和生物信息学分析,探讨外泌体相关RNA结合蛋
目的:探讨C-MYC、BCL2基因在弥漫性大B细胞淋巴瘤的易位情况及临床意义.方法:收集2015年10月~2019年1月福建省肿瘤医院病理科确诊的弥漫性大B细胞淋巴瘤患者42例,采用免疫组织