一种基于综合不放回抽样的随机森林算法改进

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:sentown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是大数据服务计算的一个重要方法,对于优化服务计算有重要意义。作为一种典型的数据挖掘方法,随机森林有着较高的正确率,因而得到广泛的应用。为了更加准确高效地处理服务计算中的大数据问题,进一步提升随机森林的正确率和效率,成为一项极其重要的研究。通过改变训练集的样本量和样本抽样方法,对平衡样本集和不平衡样本集进行分析,发现通过上述两个改进后,在优化区间内,平衡样本集泛化误差会减小12%~20%;单项改变抽样方法,可以使算法时间缩短,提升效率达10%~40%;对不平衡数据,也能够明显提升效率。理论和实验均证明,基于综合不放回抽样的随机森林算法改进能够提升平衡样本的正确率,使得该数据挖掘方法更适用于服务计算中的大数据分析和处理。
其他文献
戴伦(滁州市全椒人民医院急诊科,安徽滁州239500)血管紧张素转换酶抑制剂(angiotensin-converting enzyme inhibitors,ACEI)和血管紧张素受体拮抗剂(angiotensin receptor bl
本文介绍我院从加强护理文化建设着手,推进优质护理服务的成功经验。医院通过挖掘中医护理内涵,培育先进的服务理念,形成以人为本的共同价值观,优化护理流程,建立护理行为规
农村留守儿童最突出的问题是心理问题,这一问题已引起社会各阶层的关注。农村学校是对留守儿童进行心理健康教育的最理想场所,我们应有效利用农村学校现有的教育资源,充分发
概述连方教授月经调周"八期理论"关于经后三期的治疗机理,阴阳消长特点及临床调周治疗应用经验。
星期天,爸爸带我去招宝山游玩。来到大门前,抬头就看见门上挂着一块匾(biǎn),上面写着几个金光闪闪、苍劲有力的大字:招宝山旅游风景区。
基于矿物组分分析及静态岩石力学实验测试方法,对塔里木盆地西南部地区古近系膏泥岩取样,并进行了不同围压条件下的岩石力学实验分析。结果表明:从单轴测试条件过渡到三轴测
云计算机技术的出现,革新了IT产业界,指明了IT行业未来的发展,在较大程度上集中和提高了IT基础架构运营的专业化程度,对基础架构提出的要求也不断升高。而网络虚拟技术因为具
<正>有人说,汉英两种语言的一个最大差别是汉语用动词多,英语用名词多,因此提出“汉语中有些动词有时在英语中改用名词,会更添英语味儿”。这里所谓的名词,恐怕主要指英语名
由国家计委批准立项,交通部投资兴建的“八五”重点建设项目——交通部公路交通试验场一期工程,于1995年8月25日顺利通过交工验收,即将投入使用。 这座综合性的试验场由交通
深夜,月亮悄悄地来到我们身边。月亮把手印放在马路上,马路变得格外明亮。