基于L1正则化Logistic回归模型的P2P网络贷款风险测度应用研究

来源 :广州大学 | 被引量 : 3次 | 上传用户:d102169104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络贷款是一种点对点的借款行为方式,它作为整个借贷环节的中介方,为借款方、投资方提供借贷服务,并以收取相应的费用作为盈利模式。该贷款方式创新性地把现代民间借贷业务的资本市场、互联网人工智能信息技术、金融服务项目和电子信息商务平台综合起来,通过互联网平台把汇聚在一起的小额资本以类似债券的形式借贷给有需求的人或者中小微型等企业。至2018年底,类似网络借贷功能的平台已经超过6000家,这些平台与传统正规的金融业务不同,他们容易获取大量资金和利润。由于个人信用问题、政策未及时落实等因素造成借款方未按期还款、平台中介“卷款跑路”等现象,使得该领域成为一个高风险行业。2018年我国存在异常的平台共4672家,占总平台数的比值高达77.4%。本文从引发网贷款信用风险的原因作为切入口,深度剖析其风险成因,结合实证分析,对我国提出政策性建议。由于国内P2P网贷的规模较小以及数据的完整性不高,因此本文针对目前全球规模最大的P2P网络贷款平台,美国Lending Club。研究中收集了2016年至2018年共三年的数据库,多达1340797个样本,其中有效样本为43041个。文章分为四个模块进行阐述。首先介绍了信用和风险的相关理论以及目前我国P2P网贷行业存在的问题和政府的整顿措施。其次分析了机器学习思想及其核心技术。针对所收集的数据样本,讨论和比较了不同机器学习模型的优劣,最终选择Logistic回归模型对P2P网络贷款风险测度进行研究。再次,为了寻找最优模型,文中还引入了L1、L2正则项对该模型进行优化。通过机器学习方法的研究,发现L1正则化Logistic回归的风险评估效能(AUC=0.838)显著优于传统Logistic回归(AUC=0.740)和L2正则化Logistic回归(AUC=0.791)。实际结果符合理论情况,说明Logistic回归模型对P2P网络贷款风险测度研究是可行和可靠的。最后总结了风险测度方向是P2P网贷行业稳步发展的必要条件等结论。与此同时,对未来P2P网络贷款业务提出政策建设建议,这对我国后期完善P2P网络贷款服务体系具有非常重要的参考价值。
其他文献
系统地梳理建国后高考作文命题的基本走向,对我们准确把握高考作文的命题规律、教学规律和复习规律,当不无裨益。一、建国后高考作文命题的基本走向 1.题目形式上,从命题走向话题
目的探讨磷酸奥司他韦治疗流行性感冒的效果。方法选取该院2016年1月至2017年6月收治的流行性感冒患者120例,按随机信封法分为对照组和观察组,每组60例。对照组给予口服莲花
税收国际协调是世界经济一体化过程中的重要议程。本文介绍了税收国际协调的意义、内容、主要形式,分析了税收国际协调的现状和发展趋势,提出了完善我国的税收国际协调工作的建
乘客出行规律对城市轨道交通运营管理至关重要,而不同时间粒度下观测到的客流规律差异较大。以往研究缺乏多时间粒度车站层级客流规律的量化研究。本文基于刷卡数据分析不同
本文分析了旅游和文化的关系,指出文化是旅游的本质属性,文化是旅游业的核心旅游资源,旅游是文化传播的重要途径。阐述了旅游和文化相互作用和影响,文化提高了旅游产品的竞争
成本法在机器设备评估中具有重要的地位,本文研究成本法在机器设备评估中的操作方法,归纳应用中注意的问题,并通过具体案例来阐明成本法在机器设备评估中的应用。 The cost
卫河流经焦作市、新乡市、鹤壁市后于淇门入浚县,再流经浚县县城和滑县县城后于五陵入内黄县。由于上游工业和生活污水排放,使地表水严重受到污染,水质为超V类水。卫河河床高
霍桑一生中创作了数以百计的作品,也塑造了很多形象鲜明、栩栩如生的女性形象。他通过对这些女性形象的刻画、心理的描述和命运的诠释,反映了自我对于女性的观念和对女权主义
目的研究慢性阻塞性肺疾病(COPD)患者血清中5羟色胺(5-HT)的表达水平及临床意义,旨在为探讨COPD发病机制提供相关的理论依据。方法选取我院呼吸与危重症医学科门诊2015年1月~
中华文化中,鹿经常具有长寿的特征。东晋葛洪称其寿命非人类可比:“虎及鹿兔,皆寿千岁,寿满五百岁者,其毛色白;能寿五百岁者,则能变化。”(《抱朴子内篇》卷三)至南朝任唠《述异记》,这