基于IV特征选择的Stacking集成学习车贷违约识别

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:ltxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着经济与互联网技术的快速发展,越来越多的人开始依赖互联网满足生活中方方面面的需求,包括医疗、消费、学习等各个方面,很多人开始适应并追求超前消费来满足日常需求。在此环境下,汽车贷款行业应运而生。然而相比于其他国家,国内的汽车贷款起步较晚,目前的汽车贷款比例只有39%,而国外的汽车贷款比例已经达到70%,可见现阶段我国的汽车贷款行业仍处于初步发展阶段,因而如何通过提高对汽车贷款逾期识别的精准度来有效进行汽车贷款的风险防范,从而促进汽车贷款的发展,是当前我国汽车贷款业务迫切需要解决的问题。本文选取一家金融公司的真实个人汽车贷款数据作为研究对象,基于此研究样本,在进行数据预处理后,本文提出基于SMOTE-ENN重采样方法的Stacking集成学习模型用于个人车贷的逾期识别,并使用集成学习方法不断优化模型效果,旨在提高个人车贷逾期识别的精度。该篇论文主要包括以下五个组成部分:第一章,主要介绍了本文的研究发展的背景、意义、国内外的研究发展现状以及这篇文章的主要研究内容和方法技术路线。第二章,对本文采用的SMOTE过采样、ENN欠采样、SMOTE-ENN组合采样的三种重采样算法以及Bagging、Boosting、Stacking三种集成算法的原理展开详细叙述。第三章,详细介绍本文的数据来源与数据内容,并进行异常值处理和缺失值处理等数据清洗工作,接着进行特征构建,并利用IV值进一步进行特征筛选,并对预处理完的数据集进行描述性统计分析。由于数据的非平衡性,分别使用三种重采样方法处理数据,最终得到四份数据集用于后续的实证分析。第四章,首先选取用于评价集成模型效果的指标,接着分别使用单模型、Bagging算法、Boosting算法、Stacking集成算法对数据进行建模预测,得出单模型与集成算法在这五个指标上的表现,其中单模型包括Logistic回归模型、决策树,Boosting选取了XGBoost、Light GBM两种算法,Stacking将前三类模型中的Logistic回归、随机森林、XGBoost三种模型融合在一起。最终得出SMOTE-ENN组合采样最有效,集成模型效果远优于单模型,Stacking集成算法表现最佳,且特征筛选能够比较显著的提升模型效果。证明了集成学习在个人车贷逾期识别上的可行性和有效性。第五部分,对本文进行总结及展望,提出本文还可以进行深入研究的方向。
其他文献
在教育现代化进程加速推进的情况下,在对小学科学学科核心素养进行培养的过程中,对小学科学课堂教学追求品质教学、打造品质课堂、培养品质学生的呼声越来越高。文章通过实际教学实践和研究,对农村小学科学课程校本化的实施进行了探讨。论文首先介绍了农村小学教学现状以及校本课程实施的背景,然后明确了校本化课程实施的目标和原则,最后提出了小学科学课程校本化的教学实施策略,并通过具体例子加以证明,以期达到高质量教学、
期刊
近年来,人们对于医疗保健的需求持续增长,医疗资源正逐渐面临供需不平衡的局面,互联网的飞速发展带来了诸如好大夫在线、微医网、阿里健康等一大批在线医疗社区平台兴起,另外,新冠疫情的爆发与持久性,增加了人们对于医疗保健的关注,同时也更大程度的促进了在线医疗平台的发展。使用在线医疗平台就留下了很多的用户评论,通过对在线医疗评论的分析挖掘可以对我国的在线医疗平台的发展情况有一个清晰客观的评估,同时可以进一步
学位
个人信用风险评估对于商业银行和开展信贷业务的金融机构来说是一个非常重要的问题,他们在处理贷款业务时需要非常谨慎以避免任何财务损失的不当决定,依赖人工手段判断放贷风险既耗费时间也耗费资源,设计实现提供信用评估的编程模型可以使发放贷款更加科学和高效。信用评估模型的优劣会对信贷机构损益和金融市场秩序产生影响,且不同信贷业务领域所获得信贷信息也有许多差异。随着信息技术的发达,个人信贷数据呈现出复杂化、量级
学位
随着经济的发展,金融市场越来越深不可测,其特征波动规律难以掌握,因此专注于股市波动的研究对于广大散户意义重大。一方面,研究股市规律能对社会、经济和金融的发展起到明显而有效的促进作用;另一方面,也可以通过科学方法有效地控制市场风险从而获得收益。近年来,国内外众多学者都专注于波动性的研究,其中金融时间序列模型和神经网络模型不断发展且趋于稳定,它们被广泛应用于金融市场等各个领域中。由于单一模型在应用过程
学位
目前,我国市场经济前景广阔,上市公司众多。我国经济正处于快速发展阶段,但相关机制不太完善,导致上市公司财务违规行为频发,虽然已经采取监管措施打消了部分上市公司财务违规行为,但仍存在一些问题。有的公司为了自身利益而造假财务状况并向证券市场传递未经审计的财务报告,所以如何有效过滤和抵制上市公司财务违规对现在的中国证券市场是一个关键问题。在此背景下,本文对各种识别财务违规模型进行了研究及改进,对模型的识
学位
融券卖空机制是一种创新型市场交易机制,在证券市场上发挥着重要作用。2010年仅有90只融券标的证券,后来经过六次扩容,截止到2020年已有1600只股票可被融券做空。融券业务在我国得到了飞速发展。实际上,融券卖空业务为投资者提供多样化的投资机会和风险回避手段。众多学者表明,只有掌握一定私有信息的投资者才会进行卖空交易,卖空机制不仅可以加快负面消息融入市场的速度,同时也对公司治理起到一定程度的外部监
学位
“十四五”规划要求发展壮大城市群和都市圈,推动城市群一体化发展,统筹推进基础设施建设,优化空间结构,形成网络型城市群,加快城市群轨道交通网络化。基础设施建设是经济社会发展过程中必不可少的条件,它是社会居民生产和生活所必需的物质基础,良好的基础设施能够对居民的生活环境产生较好的影响,提高居民生活水平,基础设施对于投资环境具有重要的影响作用,因此,加强现代化城市基础设施建设,改善生活环境,努力提高城市
学位
公共服务是政府的重要功能,特别是中国农村基本公共服务是我国居民生活水平的重要影响因素,基本公共服务也是人们生活和发展所需要的必要基础条件。近年来,农村基本公共服务水平不断完备,整体发展优良,但由于资源和经济等条件不同,导致区域间农村基本公共服务水平存在差异,农民一直生活在农村基本公共服务投资不充分,供求不一的环境中,大多数农民的生活需求都没能得到满足。如今,我国基本公共服务均等化是一个亟待解决的问
学位
国有企业是中国特色社会主义市场经济的坚固基石,在各个极具战略地位的行业领域中扮演着至关重要的角色,关系到一系列的国计民生。习近平总书记在全国国有企业党的建设工作会议中指出,要保证国有企业“成为壮大综合国力、促进经济社会发展、保障和改善民生的重要力量,成为我们党赢得具有许多新的历史特点的伟大斗争胜利的重要力量”。因此,为了推动国有企业的稳定良性发展,围绕着国有企业绩效这一衡量企业经营情况的重要指标,
学位
随着互联网技术与金融行业的进一步融合发展,互联网金融让人们享受到了技术进步给人们工作和生活带来的便利,同时互联网金融的创新实践也给企业和个人带来了新的机遇和挑战。对于金融监管部门来说,防范化解潜在的金融风险,打击洗钱等金融犯罪行为应时刻放在首要位置。预防和打击洗钱行为一直是金融监管部门的重点和难点。随着社会的不断发展进步,科学技术的应用越来越广泛和多样化,不法分子的洗钱手段也在不断地更新换代,变得
学位