基于Spark框架的用于金融信贷风险控制的加权随机森林算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:huapdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决互联网时代线上贷款业务量庞大带来的困扰,优化快速迭代的数据模型,从线上贷款业务的特点出发,以Spark分布式计算引擎为核心设计并实现了能够并行处理非平衡数据的加权随机森林算法.该算法从特征切分点抽样统计、特征分箱、逐层训练三个角度对加权随机森林算法进行并行化优化.该算法有效提高了随机森林算法的分类准确率,同时有效降低了决策过程中出现的平局现象.对非平衡数据,该文章通过SMOTE算法对数据进行重构,较好的保留了原有数据集信息.实验表明,该算法能够有效提高放贷效率性与及时性,极大的提高了生产力.
其他文献
SAR回波仿真在SAR系统设计及验证成像算法上具有十分重要的意义。利用传统的时域方法模拟回波,精度较高但耗时时间长,仿真速度慢。本文主要研究了一种改进的同心圆算法在SAR
王建民是著名的当代作曲家,他在民族器乐创作领域取得的成绩备受注目,特别是五首二胡狂想曲每次推出都能引起二胡演奏家和音乐学者的关注。他将创作实践中经验和思想加以总结
非寿险索赔准备金评估方法是非寿险保险公司资产负债表中重要的一部分,也是中国保险监督管理协会对保险公司监管的评估手段。评估索赔准备金的方法可以分为一元索赔准备金评
<正>疑难重症是两个概念的合一疑难病:诊断、治疗困难的病证。重症:病情严重的病证。二者常合一,而且不论中西医学,处理疑难重症的能力历来是评价医师技术水平高低的重要指标
会议
缓慢黏性流体的最小能耗率原理在1868年提出后受到了人们的高度关注。最小能耗率原理在不断发展和完善的同时,在河流动力学领域的应用中出现的问题也越来越多,受到水利界的高度
【摘要】口语交际是现代学生必须具备的一项语文基本素养,也是小学语文教学的一项重大改革,它崭新的理念给语文教学带来了一股新风,然而在实际教学中并未真正落到实处,就此作者结合教学实际谈了几点体会。  【关键词】小学语文 课堂教学 口语交际  随着改革开放的深入和市场经济的快速发展,口语成为人类最基本、最便捷的交际工具,自然担负起社会交际的重要任务,而口语交际能力就成为当代人适应社会,满足社会交际最基本
反相HPLC法测定3种延胡索生物碱含量祝晨,何宏贤,金蓉鸾(中国药科大学南京210009)灰绿延胡索CorydalisglaucescensRegel,长距延胡索C.schanginii(Pall.)Fedtesch.及对叶延胡索C.ledebour... Determination of three kinds of corydalis alkaloids by reversed
近年来,随着我国城市化程度提高和道路交通运输的发展,汽车需求量和保有量迅速增加,报废汽车数量也随之上升,带动了报废机动车回收行业的发展,也暴露出拆解过程的安全隐患和
为研究采煤塌陷裂缝对土壤水分的影响,选取了阜新塌陷区为研究区,应用系统聚类、Mann-Kendall秩次相关检验法及多元线性回归等数理统计的方法,研究了塌陷裂缝不同深度的土壤
我们自2004年9月至今开展腹腔镜十二指肠穿孔修补术17例,现总结报道如下。