基于集成学习的个人信用贷款违约风险预测研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:yangbao_2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的发展,各大商业银行的信贷业务也开始发展壮大。但由于存在一些未考虑自身还款能力或者恶意欺诈贷款的用户,会使得商业银行放出的贷款无法收回,从而造成商业银行收益降低甚至亏损。所以在保证“好用户”流失没那么多的基础上,精准识别出潜在违约用户并降低商业银行的不良贷款率,对商业银行信贷业务未来的健康发展是十分重要的。对此,本文使用来自多家商业银行信贷用户的贷款数据,运用集成学习的思想建立出一个可以运用到严格的贷款违约风险控制场景中的最优模型。主要研究工作如下:(1)首先对信贷用户的群体画像进行描述性统计分析,然后探寻原始数据集缺失值的分布,并对缺失值进行填充。根据特征的含义以及各特征之间的联系对它们进行特征衍生,并运用LightGBM-RFECV的特征选择方法对特征进行筛选,筛选出特征优先级为1的80个变量,作为最优特征子集,进行下一步建模。(2)其次针对本文的不平衡数据,采用七种基于数据层面的不平衡数据处理方法分别对训练集数据进行处理,再结合Logistic回归、随机森林、XGBoost和LightGBM四种分类器进行预测,在运用各项指标评估各模型的优劣之后,得出了用RENN欠采样处理数据集的方法与四种模型结合的模型综合性能最优的结论。(3)接下来将用RENN欠采样处理的数据输入到以随机森林、XGBoost和LightGBM作为第一层初级学习器,以Logistic回归作为第二层次级学习器的集成模型中,进行Stacking模型融合预测。结果表明:RENN-Stacking模型与单一模型对比提升了本文认为重要的召回率(Recall)、F2-score和AUC值以及降低了不良贷款用户率。即RENN-Stacking模型可以保证在“好用户”流失没那么多的基础上,识别出91.4%的违约用户,并且使得不良贷款用户率达到最低。基于这个最优模型,可以大大降低商业银行的个人信用贷款违约风险。(4)最后,通过LightGBM特征重要性排序选出审批贷款时应多加关注的用户特征,提高了贷款审批的效率。
其他文献
本文通过对爱德华·马奈(édouard Manet,1832.01.23~1883.04.30)油画作品中笔触运用的具体分析,进而探讨油画作品中油画笔触的独立审美价值与“绘画感”的重要价值。马奈作品中的画面质感与笔触处理,不仅对印象主义与现代绘画产生了深远的影响,时至今日也值得我们继续研究与学习,并对丰富自己的绘画语言以及对绘画感的追求有着重要的意义。
学位
随着科技的发展,大量数字图像和视频数据给人们的生活和工作带来便利的同时,也成为科学研究的重要对象,具有重要的经济价值。但是图像数据的质量参差不齐,给应用和研究带来了巨大挑战。对图像和视频数据质量进行评估,对低质量的数据进行预测和处理具有重要的研究意义。图像和视频数据在采集、存储和传输等过程中往往会受到各式各样的干扰,导致数据失真,使收集到的数据质量降低。如何准确的度量数据的质量是图像质量评价的核心
学位
在脱贫攻坚的新时代背景下,我国精准扶贫工作已经取得了一些成就,这也为教育领域的精准扶贫提供了新思路和新方向。高校家庭经济困难学生资助工作,是我国扶贫工作在高等教育领域的进一步拓展和集中体现。因此,准确判断家庭经济困难学生对实现精准认定具有重要意义。当下各高校主要通过学生上交的家庭经济困难学生认定申请表和家庭困难证明材料进行人工评定,但该方式缺乏科学统一的标准,主观性较强,容易引起学生之间的争议。因
学位
19世纪中期,随着人类社会进入到民主制和工业化时代,人们的生活也发生了天翻地覆的变化,反映在艺术领域就是现代艺术的诞生。柏林伯格(Clement Greenberg,1909年-1994年)认为写实绘画用艺术掩盖了艺术的媒介,而现代艺术用自身的独有的特征让艺术回归其本质,这个特征包括了平面性、物质性等。因为马奈的作品开始显现这些特征,所以,他认为马奈的作品标志着现代艺术的开端。马奈的绘画解构了学院
学位
埃贡·席勒是20世纪初的奥地利艺术家、维也纳分离派的领军人物之一,其作品题材以肖像和风景为主,风格大胆、个性鲜明。席勒独特的艺术风格与其曲折悲惨的人生经历息息相关,他擅长用扭曲的形体、抚摸式的线条、浓郁的色彩表现充满象征意味的情感内涵。人物画上,席勒不仅善于用独具装饰性的绘画语言表现浓烈的情绪,还善于捕捉模特的内心状态,在给观者带来强烈的视觉冲击和深刻的感动。本文以现阶段的研究基础为背景,在对席勒
学位
《攻占总统府》是中国一幅知名的历史军事题材的油画,让人印像深刻。它的画幅巨大,画面效果控制非常到位,堪称中国美术史中的精品。这一切皆因构图在画面里面起了至关重要的作用。该论文以构成画面的最重要因素之一的构图为出发点,深入研究该作品的构图视角力,构图特征,构图细节等若干方面,使经典作品分析更完整,诠释更透彻,帮助大家更容易欣赏作品,延续美的共同经验。基于作品好的规律鲜有人去细致论述这一出发点,笔者尝
学位
笔者通过综述发现,在以往学界对汉代墓葬用色研究中,出现了一种被“美术学”视阈所局限的情况。学者们往往会关注到壁画、漆画、帛画等具有“形式美感”和“图像性”的对象,但对墓葬中墙壁、地面、顶部遍施朱砂的行为,对买地券、镇墓文上的“朱书”以及器物涂朱的现象却缺乏关注和研究。同时对汉代墓葬中朱砂红使用的功能性,及其功能性成因的探讨,主要围绕“五行五色”所形成的的话题体系进行。认为在汉代墓葬中朱红色的使用主
学位
文章从文化空间理论出发,阐释文化空间与节庆类非遗的联系。即节庆类非遗在特定的文化空间中产生、发展与延续,并且在节庆类非遗项目中要依托特定的文化空间才能长期存续。以国家级非遗屈原故里端午习俗为例,阐述中国传统节庆端午节如何在新时代焕发新的生机与活力,并从文化空间的视角分析节庆类非遗保护的实现途径,为推动屈原故里端午习俗非遗保护走向全面深化发展提供新思路。
期刊
新中国成立之初,由于国家对外交流的迫切性,我国与印度这一本来就有着两千多年交往历史的国家,在“和平共处五项原则”的基础上再续前缘。而张均,作为这一时代大背景下的微小个体,却因其卓越的舞蹈功底、敏锐的感受能力、超凡的技术技巧与超强的毅力和耐力,在印度舞蹈方面体现出超越常人的特点。因此,她肩负着国家对外友好交往的使命七赴印度,最终不仅在印度舞蹈的学习、教育和表演方面收获良多,也在中印文化的交流中做出了
学位
随着互联网的高速发展,人们已经身处大数据时代,大数据时代不仅带来了多元的信息丰富了人们的生活,也带来了信息过载的困扰。推荐系统经过发展更新,已经是解决此类问题的重要技术。推荐系统可以服务于人们的生产生活,也可以将推荐系统融入国家战略发展,用科技手段促进发展改善民生。在统筹城乡规划为困难村庄选派驻村工作单位时,往往根据经验开展工作,没有形成科学性、规范化的流程,随着驻村工作的全面展开,经验已经无法满
学位