随机森林综述

来源 :南开大学 | 被引量 : 0次 | 上传用户:zp283106190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今的现实生活中存在着很多种微信息量的数据,如何采集这些数据中的信息并进行利用,成为了数据分析领域里一个新的研究热点。机器学习方法是处理这样的数据的理想工具。随机森林以它自身固有的特点和优良的分类效果在众多的机器学习算法中脱颖而出。随机森林算法的实质是一种树预测器的组合,其中每一棵树都依赖于一个随机向量,森林中的所有的向量都是独立同分布的。   本文旨在总结当前对随机森林研究,通俗地介绍随机森林的构造原理,使得随机森林被初学者易于接受。本文给出了随机森林的数学上的理论依据,并通过推导出:随机森林的分类效果与两个元素有着直接的联系,一个是单个分类器在组合分类器中的分类效能,另一个是随机森林中分类器之间的相关性。本文简单的介绍了众多随机森林的构造方法的几种常用方法。作为随机森林广泛应用的例子,本文介绍了随机森林在经济、文本分类和医学上的应用。其实还有很多的应用等着我们去开发。本文在最后还概括的给出了随机森林的回归模型,并与支持向量回归模型和一般线性回归进行了比较。Weka是一个开放的程序。在Weka中包括了很多常用的机器学习方法,随机森林也在其中,所以本文给出了Weka的介绍。   本文中提到随机森林的很多优点,但是随机森林在构建方式,编程处理及回归研究等方面还有很广泛的发展空间。需要我们共同的努力才能将随机森林发展的更好。
其他文献
立式车床是机电设备的一种,它的自动化程度要求很高。通常用于冶金工业,或者车制大型工件。因为接触控制点多,电子控制系统出现故障率很高,检修时检修周期长。长时间的使用立式机,导致电气控制系统线路老化,频繁的发生继电器故障,检修时维修十分困难。随着PLC技术的出现,对传统车床的数控改造成为很多企业和研究院所研究的课题,PLC克服了在复杂的机械接触多及传统的控制系统接线中,继电器触点可靠性低、能耗高、灵活
The effects of different habits of the drivers on gear shifting strategies for manual powertrain were investigated. For the realization of simulation, the shift
摘 要:汽轮机通流部分结垢,使汽轮机达不到额定负荷。主要原因是凝汽器内漏及锅炉对蒸汽参数控制不严格,导致蒸汽品质不合格,通流部分结垢,工艺采用对蒸汽品质从源头上严格控制和饱和湿蒸汽在线清洗的方法,消除了汽轮机结垢的现象,达到了预期效果。  以神华宁煤甲醇厂2.5万KW的汽轮机(EHNKS40/50/20)为例进行论述,2009年8月,此汽轮机在运行期间明显出力不足,在汽轮机高、低调节进汽阀全开的情
学位
浙江画院作为一家由政府全额供给的一类公益文化事业机构,每一位专职画师无疑是人民所养育的艺术家,因而长期以来,热心公益、文化惠民、建设公共文化,一直被坚定不移地视为办
近年来,“能源问题”已经成为人们普遍关注的问题,世界各地对可再生能源的发展非常的重视,我们知道风能是一种很重要的可再生能源,作为“绿色能源”的风能,由于它取之不尽,用之不竭,所以在近几年得到了非常迅猛的发展,世界上不少国家都把开发和利用风能作为一项重要的能源。作为消费大国的中国,近年来由于国家的大力投资和技术支持,风电产业也得到了快速发展。在这一背景下,本文主要对风力发电中风机叶片的外形做了研究和
现代机械设备对性能的要求越来越高,其结构也越来越复杂,机械装备的发展日趋大型化和自动化。在机械设备中,齿轮箱作为连接和传递动力的通用零部件,被广泛的应用现代工业设备中。在工程实践中,我们期望对齿轮箱故障的发生能够做到防微杜渐,不希望亡羊补牢般地处理事故。因此,研究有效的齿轮箱早期故障诊断技术,定量诊断故障程度并预测故障扩展趋势和齿轮箱剩余寿命,具有重要的社会意义和经济价值。小波分析是当前数学中一个