高维数据情形下的一种基于随机投影的集成分类方法

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:oceanspring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高维数据的分类问题,提出一种基于随机投影的决策树集成学习方法(Projection Forest,简记PJForest).该方法以决策树为基分类器,利用一系列随机投影对数据进行降维,基于降维后的数据构建相应的一系列决策树,而后通过集成学习构造集成分类器.利用适当的随机投影对数据进行降维,能保持数据几何结构的信息;且通过随机投影对原始数据进行扰动,能丰富决策树的多样性,经过适当集成可有效克服噪音的影响,进而提升PJForest的泛化能力.证明了PJForest泛化误差的极限性质,得到泛化误差在一定意义下
其他文献
高心墙堆石坝工程量大、建设工期长,自然条件和施工场地布置复杂,施工技术难度大,质量标准高,施工作业涉及众多环节且受诸多因素影响,给大坝的施工组织管理和实时控制带来很
改革开放以来,我国英语教育事业不断向前推进并且取得了十分显著的成就,然而英语教学现状与时代发展需求之间还存在着一定的差距。作为英语学习的起步阶段,由于缺乏语言学习
目的:探讨广视野镜倒像装置系统在玻璃体视网膜显微手术治疗复杂视网膜脱离中应用的价值.方法:将广视野镜倒像装置系统应用于46例复杂视网膜脱离手术,27例在气态下行眼内半导
研究了在T×R区域上二维β平面方程关于一类严格单调的剪切流的线性渐近稳定性,其中T的周期为2π.