集成学习算法在个人信用评估中的应用

来源 :湖南师范大学 | 被引量 : 5次 | 上传用户:qwertyuiop325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展,人们通过使用信用卡、蚂蚁借呗等新型产品进行提前消费以改变量入为出的传统消费观念。与此同时,形形色色的借贷方法开始流行,各类线上线下的资金借贷方式也变得越来越普遍。但从另一种角度来看,一种形势的盛行往往会引起一系列新问题的产生,当今时代信贷消费方式的流行也不例外。因而,由此所引发的客户违约问题严重影响了信贷行业的发展,进而阻碍了国家的经济发展。这一现象使得现有的信用评估体系面临着巨大的挑战,个人信用评估逐步成为信贷这一行业的研究热点,引入更有效的评估方法将更有助于经济的发展。申请贷款的客户的等级主要分为违约和不违约两种类别,可以将其看作一个分类问题进行研究。对该类问题的研究,主要是对申请贷款客户的个人经济条件、财产情况等个人属性以及历史信用记录建立分类模型,从而达到评估客户信用的目的。本文对国外某银行及国内某贷款机构所提供的金融信用数据集进行了系统的预处理,采用贝叶斯优化算法对模型进行参数优化,基于三种不同的模型对特征进行重要性分析。然后基于Bagging和Boosting两种集成学习的代表算法以及Stacking集成学习算法训练模型。其中Stacking集成分别以随机森林、支持向量机及LightGBM为初级学习器、对数几率回归为次级学习器构建评估模型。此外,本文还加入了对数几率回归、支持向量机、k近邻、决策树、神经网络等简单分类算法来进行比较。最后,使用Friedman及Nemenyi两种检验方法来比较这些模型,并绘制Friedman检验图进一步验证。基于上述模型使用10折交叉验证,验证结果表明Bagging和Boosting这两种集成学习算法训练的模型都起到了一定的性能提升作用,并且后者得到的效果更好,但使用Stacking集成模型的效果并不理想,未能有效地提升分类性能。整体来说,集成算法分类效果还是优于传统单一算法。最后,比较两种检验方法的结果可知,在置信度为95%的条件下认为部分算法的性能不同。
其他文献
当前互联网正以惊人的速度在全球不断扩张,与之相应的信息技术也广泛应用在社会生活的各个方面,从居民衣食住行的消费渠道,到新兴商业业态的运作模式再到“互联网+”概念成为
目的探讨腹腔镜手术不同CO2气腹压对于糖尿病患者肝功能的影响。方法选择单纯胆囊结石合并糖尿病行腹腔镜胆囊切除术患者60例,根据术中气腹压水平随机分为Ⅰ,Ⅱ,Ⅲ3组,每组20
目的比较静脉注射半标准剂量丙种球蛋白(IVIG)联合糖皮质激素和单用糖皮质激素治疗皮肌炎的疗效。方法分析2007-2015年的33例丙种球蛋白(IVIG)联合糖皮质激素治疗皮肌炎的临
以水稻品种金优207为材料,对不施氮肥(T1)、试验区当地农民习惯氮肥用量(T2:尿素,纯N187.5 kg/hm2)和在农民习惯施氮量基础上减量配施氮肥(T3:氮减少20%,30%农民习惯用化肥+2
现阶段,国库网络信息系统的应用使国库业务环境发生巨大变化,加强国库业务会计核算的管理可以防范及降低国库资金风险,实现央行国库管理的目标。本文首先阐述了构建现阶段央
目的观察椎体成形术(PVP)联合腰椎脊神经后支射频治疗腰椎骨质疏松性压缩性骨折的有效性。方法 78例腰椎骨质疏松性压缩性骨折患者,随机分为联合组(PVP+射频组,46例)和对照组
听力理解既是二语学习中一项重要技能,又是二语学习的一个重要途径,但它往往是学习者的薄弱环节。进行策略训练是帮助学习者提高听力理解能力的重要而有效的途径之一,为了有
冬小麦东农冬麦1号可在黑龙江省高寒地区安全越冬(返青率大于85%),研究其对低温逆境的适应特性对于了解植物的抗寒机制具有重要意义。以东农冬麦1号为试材,测定了大田自然降
我国东北黑土作为区域生态环境安全保障、国家粮食安全和农业可持续发展的重要资源,其目前的现状迫切需要通过人为措施来补充土壤有机质,以确保农业种植水平和提高农作物产品