汽车消费信贷违约风险评估研究——基于Stacking模型融合算法

来源 :中南财经政法大学 | 被引量 : 2次 | 上传用户:spirithero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国经济的发展、政府的扶持以及汽车消费群体的改变,汽车消费信贷行业得到了迅速发展。同时,汽车消费信贷的发展降低了消费者的购车门槛,从而刺激了国内汽车的消费需求,促进了国内汽车销售量的增长,推动了汽车工业的快速发展,因此汽车消费信贷成为中国汽车工业发展的新“助推器”。然而由于国内汽车消费信贷行业发展时间短,许多车贷机构没有完善的业务流程,贷款审核效率慢,并且缺乏风控管理技术,很难在海量信息中识别出可能违约的客户,导致车贷不良贷率居高不下,大量车贷机构倒闭。因此,建立一套行之有效的汽车消费信贷违约风险管理和评估体系,对借款者信用违约风险进行预警和防范具有重大意义。本文以探索准确稳定的汽车消费信贷违约风险评估模型为研究目的,以期为车贷借款人信用违约风险的评估和汽车消费信贷业的健康发展做出贡献。本文从汽车消费信贷机构的角度出发来研究借款人的信用风险评估问题,借鉴个人信用风险评估领域的信用评估风险方法,利用Kaggle数据平台提供的车贷数据,探索基于Stacking模型融合算法的汽车消费信贷违约风险评估模型。在前期准备阶段,首先进行无用特征的删除、异常值处理、决策树离散化以及归一化等数据预处理工作,然后对采用嵌入法与包装法相结合的特征选择方法对数据集进行特征筛选,建立汽车消费信贷违约风险评估指标体系,最后使用SMOTETomek算法对非平衡的数据集进行混合采样,使数据集平衡化。在模型搭建阶段,本文选择Cat Boost、随机森林、XGBoost、Light GBM模型作为初级学习器,Logistic回归模型作为次级学习器搭建了Stacking模型,并使用贝叶斯优化对模型进行调参,最终得到了分类预测能力良好的Stacking模型。在模型效果评估阶段,通过不断改变留出比例,对比分析Stacking模型融合与随机森林、Cat Boost、Light GBM、XGBoost模型等主流机器学习模型的分类能力;其次,使用PSI指标从不同样本量和不同正负比例训练集的角度出发,对本文构建的Stacking模型融合的稳定性进行评价。本文研究结果表明,将改进的特征选择方法、SMOTE-Tomek混合采样与Stacking模型融合相结合来构建的汽车消费信贷风险评估算法具有良好的分类能力和稳定性。同时,本文建议在汽车消费信贷行业内部建立健全数据共享系统,增加模型训练数据来提高模型的分类预测精度;并且应该从借款人的贷款信息、历史信用信息和个人信息三个方向出发构建汽车消费信贷违约风险评估指标体系。
其他文献
在全面建成小康社会决胜之际,我国经济已经转向高质量发展阶段。实体经济是中国国民经济的脊梁,制造业则是实体经济的基础支撑,因此制造业高质量发展是我国制造业实现从制造到创造、由速度到质量、由大国到强国的第一要义,是推动我国国民经济发展、提升综合国力的殷切需要。后疫情时代背景下,只有高质量的基础制造业才能对中国经济高质量发展提供坚实的战略支撑。目前的研究成果一般围绕高质量含义的解释,制造业高质量发展评价
学位
2020年初新冠疫情的爆发,对我国的国民经济造成了巨大冲击,我国金融市场遭受重大风险,我国股票市场发生震荡,疫情引发的风险冲击着我国股票市场并在股票市场中传染。探究疫情影响下我国股票市场风险的传染特征对于以后重大突发公共卫生事件下制定预防、降低以及控制股票市场风险传染的金融措施具有重要意义。目前关于此方面的研究较少,本文基于复杂网络视角,探究新冠疫情背景下我国股票市场风险传染特征,进一步研究疫情冲
学位
建筑电气设计工作质量的高低直接制约着人们对建筑体应用的舒适程度,而消防配电设计对人民生命财产安全具有重要联系。所以,在建筑电气设计期间,消防配电设计尤为重要。由此,该文就建筑消防配电设计展开全面分析。
期刊
数字货币即货币的数字化,其一般情况下由开发者发行和管理,它可以替代电子货币的形式。去中心化、数量稀缺等是以比特币为代表的数字货币的特点,其深受投资者的喜爱,全球各国对数字货币的关注程度也随着其市场规模的扩大和种类的增加而增大。但是,隐藏在数字货币背后的风险也是不可忽视的。一是价格剧烈波动诱引大量投机也引发了泡沫经济,价格剧烈波动,投资者追逐高利益的同时忽视了其潜在风险,酝酿了巨大的泡沫;二是劣币驱
学位
随着信息化技术与医疗领域结合的深入发展,临床医疗相关数据的挖掘与应用逐渐成为热点研究领域。相对于普通病房而言,重症加强护理病房(ICU)的患者数据在数据的种类和标准化上的质量都更高,更有利于根据患者的医疗数据进行研究与分析。本文的研究是基于MIMIC-Ⅲ重症监护数据库展开的。首先对MIMIC-Ⅲ数据库做了探索性分析。接着,按照《国际疾病与相关健康问题统计分类》第九版(ICD-9)对疾病的定义和分类
学位
随着人工智能和大数据技术的普及,经济社会进入数字化时代,数字化凭借其高渗透性、替代性和协同性,正在影响到社会生活的方方面面。在我国数字经济相关政策的鼓舞下,各行各业与数字化的融合速度加快,本文旨在研究数字化水平的提升对企业提升生产效率是否有正向作用以及这种刺激作用是否显著。为了观测数字化的持续影响作用,本文选取沪市A股819家2009-2018年间一直有年报披露的上市公司为研究对象,剔除ST、*S
学位
本文梳理了公路养护管理和公路资产管理不同的概念和工作内容;阐述了公路资产货币化量化计算的基本思路;提出了公路资产管理目标和公路资产管理平台建设框架,供大家参考。
会议
2020年既是我国实现全面小康的收官之年,也是全球新冠肺炎疫情的肆虐之年,理想实现与现实挑战的碰撞,为我国推动医疗卫生服务供给侧改革提供了重要契机。同时,随着我国人口结构和居民生活方式的快速变化,对足量、优质医疗卫生资源的需求迅速扩张,而医疗卫生资源的供给仍面临较大约束。因此,如何突破发展瓶颈、保障和改善各地区医疗卫生资源供给,是我国在实现更高质量小康的进程中亟待解决的现实问题。本文以2013-2
学位
近年来,随着全国公路里程的逐年增加,公路养护管理任务日益加重,养护资金需求也在逐年加大,如何科学合理确定养护费用投入、平衡养护资金与养护质量、管理效益、社会效益等方面之间的关系成为当前一个重要的问题。基于此,从公路全寿命周期过程中养护运营期资产管理理念出发,给出了公路养护运营期资产管理系统建立的相关思考,明确了公路养护运营期资产管理体系要素、最优的养护费用投入策略和基本原则。
期刊
为了提高公路养护工作的水平,降低养护成本,提高养护质量,以公路养护单位为例,对当前公路养护单位固定资产管理中问题进行分析,比如记录账目不清晰,会计审核不到位,管理意识不强,固定资产的使用和配置监管不到位等。根据问题思考如何加强固定资产管理的工作措施,制定可靠的控制对策,有效提高固定资产管理水平。后发现观念意识、制度建立、资产利用率提高、创新方法等方式对于公路养护单位固定资产管理工作的提高有显著作用
期刊