基于GA-PSO-CatBoost的信用贷款违约预测

来源 :江西财经大学 | 被引量 : 1次 | 上传用户:baiseshiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术还未发展成熟以前,在风险评估领域,一般采用传统的计量模型,使用少量的贷款用户数据,来制定一套评估信用风险的准则。而随着计算机的高速发展,大数据时代的来临,借贷机构可以轻松获取大量的贷款数据,如果直接使用传统计量模型,由于其模型的解释能力较差、拟合不完全等问题,在此场景下将其用于信用评估将会丢失大量有用信息。而机器学习模型能够处理高维度、大样本的数据,能够极大地提升信用风险评估的准确性。因此在新的时代背景下,需要对信息评估系统进行更新,建立更有效更精确的信用评估模型。因此本文选择可高效处理高维数据的XGBoost、Light GBM、Cat Boost模型,再分别从数据层面、算法层面对模型进行优化。本文首先阐述了XGBoost、LightGBM、CatBoost模型以及遗传算法、粒子群优化算法的相关理论,并以Bank loan数据集作为研究对象,对数据进行整理和清洗,同时对贷款用户的基本情况进行初步分析。在数据层面,使用多种重采样方法对数据进行处理,减少不平衡数据带来的影响,发现ENN下采样方法可以达到最优的拟合结果。在特征选择方面,通过使用遗传算法的随机搜索来选择最佳子集为后续的模型建立打下基础。最后分别建立XGBoost、Light GBM、Cat Boost分类预测模型,使用粒子群算法进行优化,并与其他模型进行比较。实证结果表明,在经过遗传算法特征选择,粒子群优化算法进行超参数优化后,不仅能提高模型的泛化能力,同时还能提高模型的运行效率。其中Cat Boost在所有的模型评估指标中都要优于XGBoost、Light GBM以及其他传统的机器学习模型,测试集上的AUC值高达0.9433。最后通过Cat Boost模型输出6个影响度最大因素:last_week_pay、int_rate、sub_grade、tot_cur_bal、tolal_rec_int、recoveries。这些因素对预测是否违约的影响都非常大,累计贡献率超过85%,为建立信用风险评估指标体系提供一定的参考意见。
其他文献
近年来,我国服务业迅猛发展,其在经济社会中的地位大幅提升,所起到的作用也愈发重要,为产业结构升级调整、发展方式转型优化、民生问题有效解决提供了坚强有力的保障。但随着经济的快速发展,环境污染问题频现,因此就需要进行绿色转型。在日益严峻的环境形势下,我国政府制定并实施了环保法规,持续提升服务业绿色全要素生产率,促进我国服务业的绿色发展,充分发挥其在绿色经济中的促进作用,最终形成既保护环境又达到经济红利
学位
伴随着互联网的普及以及信息化等技术水平的提升,我国数字经济发展的规模在不断地扩大,数字经济提高了企业的发展效率,提高了人们的生活品质,数字经济对于国民经济的发展起着至关重要的作用,在我国发展中的地位也越来越高。现阶段,服务业作为带动经济增长的第一大产业,与数字经济之间的融合程度日益加深。因此明确数字经济的影响机制,抓住数字经济所带来的机遇,对于改善服务业发展中存在的问题,提升服务业发展质量有着重要
学位
自中国实行改革开放以来,国家经济高速发展。而经济迅猛发展的背后也隐藏着资源利用率低和环境破坏的问题,这种粗放型的经济发展模式限制着经济的长期稳定发展。在现阶段,中国面临着协调环境保护和经济发展的挑战,实现环境保护与经济发展之间的平衡是实现中国可持续发展目标应有之义,以绿色发展为目标就要平衡经济发展与环境保护,进行经济的绿色转型。党的十九大报告的提出,新时代经济高质量发展便是“建立健全绿色低碳循环发
学位
《中共中央国务院关于做好2022年全面推进乡村振兴重点工作的意见》即2022年中央一号文件提出,要加大对乡村旅游的发展,引导并鼓励农民参与乡村民宿的经营。中国十四五规划纲要提出,要大力发展民宿经济、乡村旅游等特色休闲产业。民宿作为旅游业的新业态形式,不仅能够促进旅游业整体的发展,也是助力乡村振兴战略的重要抓手,所以国家大力鼓励民宿行业的深入发展。其中于2020年8月发布的《江西省人民政府办公厅关于
学位
2008年的金融危机使学者们认识到金融稳定的重要性,重新思考商业银行在货币政策传导渠道中的扮演的角色,提出了货币政策的一条新的传导渠道:银行风险承担渠道。该渠道认为,在货币政策传导过程中,银行并非仅仅是风险中立的传导中介,货币政策会影响银行风险承担意愿的调整。然而银行风险承担渠道与其他货币政策传导渠道密切相关,在对该渠道进行单独考察时,倘若没有事先排除其他渠道的干扰,则会削弱研究的可靠性。同时,伴
学位
现阶段,我国经济正向高质量方向转变,同时正面临着新一轮的革命;数据资源已成为一项重要资产,不仅在国民经济运行中扮演着重要角色,而且在实现社会主义现代化建设过程中也发挥着至关重要的作用。在提出将数据作为生产要素参与市场配置的今天,如何有效测度数据要素对经济社会的赋能效应,揭示数据新动能的发展水平,挖掘数据要素的潜在价值,是目前亟需解决的问题。对此,本文从ICT产业视角出发,基于2010-2019年3
学位
小学数学是小学教育阶段的基础课程,提升小学数学课堂教学效率有助于贯彻落实“双减”政策。然而当前小学数学教学中还存在一些问题,影响学生的数学核心素养培育。“双减”政策要求教师在教学过程中尊重学生的主体地位、融入与生活相关的内容、培育学生的数学核心素养。因此,为了切实提升小学数学教学质量与学生课堂学习效率,教师要立足“双减”政策要求,采取改善不良情绪,激发学生积极情感体验;加强教育信息化建设,增强课堂
期刊
小学数学教师基于智慧课堂开展小学数学教学,能够实现对传统教学形式的调整。为此,教师要结合学生的发展特点、能力基础等,对原有的教学方案做出调整,以助力学生完成对知识的深入理解,让其主动参与对新知的探索,形成良好的学习习惯,逐步发展数学核心素养。教师要对智慧课堂的价值和作用进行正确的认知,在教学过程中要合理引导学生,让其主动参与并高效完成学习,逐步形成良好的数学思维和数学素养,进而取得良好的发展。
期刊
中国经济经过40多年的高速发展,取得了丰硕的成果。现阶段我国经济发展已经步入“新常态”,从高速发展转向高质量发展,经济的高质量发展将是我国各项领域发展的未来主题。就业作为最大的民生,其高质量发展将是各个领域的重要基石。而农业转移人口作为我国经济发展的重要支柱力量,其就业质量虽然经过较大的提高,但总体上仍处于低位,普遍存在着工资低、劳动强度大、就业稳定性差和社会保障不足等问题,其就业质量仍有非常大的
学位
家庭是社会经济活动的基本单位,而家庭参与投资的活跃程度也是我国经济活力的重要表现,近年来,我国的家庭开始越来越重视理财,越来越注重金融资产配置,2021年10月由欧洲安联集团发布的《2021年安联全球财富报告》显示,2019年与2020年中国家庭金融资产总额的增长连续两年超过10%,增速远高于全球平均水平,2020年中国家庭金融资产总额超过2.5万亿欧元(约合人民币18.6万亿),占亚洲地区金融资
学位