基于机器学习算法的网贷平台违约风险预警研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:zhwenh_0421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网贷平台积聚的风险开始显现。许多正常运营的网贷平台由于审核不严格,常常依靠粗放的人工审核方式,缺乏科学的违约风险预警手段,导致借款人的违约率居高不下。而过高的违约率严重影响了网贷平台的正常运转,同时增加了我国的系统性金融风险。在此背景下,如何选择科学的方法进行网贷平台的违约风险预警,降低网贷行业整体金融风险,已经成为学界和业界共同关心的问题。本文的研究目的是比较传统统计学方法与机器学习算法在网贷平台违约风险预警的效果,以确定最适用于网贷平台的违约风险预警工具,为网贷平台的借贷审核提供科学的决策依据,同时解决网贷平台违约率风险过大、人工成本过高的缺点,为网贷平台的良性健康发展提供支持,也能够间接降低我国整体金融风险。在此基础上,本文也指出了一系列可以作为网贷平台违约风险预警的指标,为实务中降低网贷平台金融风险提供参考依据。本文首先介绍了我国民间借贷的发展历史,以及在新世纪转变为网贷平台的历程;然后回顾了国内外学者对于网贷平台违约风险控制的方法;接着介绍了国内外网贷平台的风险控制方法;此后,本文又针对大数据风控方法,具体介绍了各种统计学模型和机器学习算法的理论基础和数学原理;在此基础上,本文选用2015年5月至2017年2月的拍拍贷真实交易数据集进行模型训练和测试。最后,本文得出了模型训练的结果,发现机器学习的集成学习算法在样本外测试集的准确率平均值高达89.49%,明显超过Logistic模型在样本外60.94%的准确率,说明机器学习算法的违约风险预警能力总体强于Logistic模型。并且本文还在机器学习算法内部进行比较,发现AdaBoost算法的预测准确性最高,其在样本外的准确率达到91.70%,并且在训练集中的训练结果也较为稳定,因此,本文建议选择机器学习中的AdaBoost算法(基分类器为决策树)处理网贷平台的违约风险预警问题。最后,本文通过Logistic回归模型的显著性结果,得到了一系列有助于网贷平台违约风险预警的预警指标,并且建议将Logistic模型得到的显著指标与机器学习算法相结合,在实务中搜集用户对应的指标信息,并且通过训练后的机器学习算法进行违约风险预警。除此之外,本文也讨论了机器学习算法在区分违约样本时准确率不足的局限性。虽然机器学习算法区分违约样本的能力优于Logistic模型,但是也仅能识别约13%的违约样本,本文认为这是随着时间的推移,违约样本数据特征改变的结果,因此建议在未来的研究中进一步考虑行业因素、宏观经济背景等对违约风险的影响,同时建议网贷平台之间、网贷平台与其他机构之间能够相互共享信息,提供用户更加多维的数据特征,以进一步提升机器学习算法的样本外预测分类能力,提高机器学习算法的违约风险预警能力。此外,本文还讨论了数据样本时间段较为单一对本文结论普适性的影响。本文没有考虑到网贷平台发展的不同阶段的具体情况,在不同时间段内统计学模型和机器学习算法的违约风险预警效果可能会有较大差异,这些均可能影响到本文结论的准确性,将在未来的研究中进一步改进。
其他文献
近年来,股权质押作为一种新兴的融资方式,迅速受到众多上市公司股东的青睐。在我国的资本市场中,控股股东往往有强烈的资金需求,却碍于控制权削弱等因素不愿通过减持的方式来融资,此时股权质押就成了更加便捷的选择,不影响控制权,限售股也可以进行质押,拓宽了融资渠道。同时,流动性高、变现快、具有非实物性的股权更容易被质权金融机构接受,而相关金融机构能够在违约发生后以较低的代价及时对股权进行处置,从而实现有效的
投资活动是现代企业发展的基础,企业投资效率的高低将直接影响到企业价值。如何提高企业投资效率,以成为学术界重要的研究话题,目前国内外学者从股权制衡、内部控制、会计信息等多个角度对企业投资效率进行研究。本文基于企业投入视角出发衡量及研究企业投资效率,通过采取Richardson模型对企业预期的投资水平进行估计,并以企业实际投资水平与预期投资水平之间的残差作为投资效率衡量变量。当企业实际投资水平与预期投
2008年国际金融危机爆发,为了应对社会各界对金融工具会计准则应用过于复杂以及对已实现损失模型的顺周期的诟病,国际会计准则理事会(IASB)自2009年起经历多次修订,于2014年7月正式发布《国际财务报告准则第9号-金融工具》(以下简称“IFRS9”)。为实现我国企业会计准则与国际会计准则的持续全面趋同,财政部也已于2017年3月,发布了修订的《企业会计准则第22号——金融工具确认和计量》(以下
据世界卫生组织预测,到2020年抑郁将是导致人类死亡和残疾的第二大致病因素[1]。青少年是抑郁的易感人群,抑郁不仅危害青少年的身心健康,同时也会给家庭、社会带来沉重的负担。由此,本研究旨在通过探究青少年抑郁症状的发生及发展规律,为青少年抑郁的预防与干预提供依据。本研究由两个部分构成:研究一通过使用流调中心用抑郁量表(CES-D)对5086名12至21岁的学生进行大样本横断面调查,分析青少年抑郁症状
土地经营权流转对于优化农村土地资源配置,对促进农村劳动力转移、推进以人为本的城镇化、适应农业科技进步和改进农业生产手段具有重要意义。但土地经营权流转必须尊重农民的意愿,作为土地流转过程中的微观决策主体,农户满意度直接影响土地流转的规模和效果。作为辽宁农业大市的锦州,农用土地资源丰富,但一直以来土地流转率并不高。随着“三变”改革的推进,锦州市农户对土地入股新型经营主体的满意度逐渐增加,锦州市农村土地
背景:移动学习已经成为人们获取知识的重要途径,但是移动学习作为一种高度碎片化的学习方式,其碎片化的学习时间、片段化的学习内容以及复杂多变的学习环境等也为学习者带来了注意力分散的负面影响。使学习者难以维持较长时间和较高水平的专注力,因而很难进行深度学习。学习效率低下和专注度不高等问题已经成为移动学习所面临的重要挑战,探讨移动学习情景下专注力的影响因素,有利于帮助学习者实现高效深度的认知学习。目的:(
本文研究贵州省分级诊疗制度的推行现状及存在问题,探索构建政府、综合医院、基层医疗机构及患者之间的博弈模型,旨在为政府治理、医院管理、患者宣教提供参考,助推分级诊疗制度落实。通过文献查阅、专家咨询、问卷调查获取国家政策、卫生资源配置及居民认知等相关信息,采用描述性统计方法分析了贵州省分级诊疗制度的推行现状及其存在问题,探究综合医院、基层医疗机构及患者之间的博弈特征,构建政府、综合医院、基层医疗机构及
随着我国经济社会发展迈入二十一世纪又一个十年,人们对于生态文明的重视呼之欲出。随着“既要金山银山又要绿水青山”的说法提出,环境保护的概念逐渐从一句口号变成如今贯彻经济政策制定的指导精神。随着我国在环境保护问题上的不断重视,与之配套的一系列立法、司法制度也逐渐完善。尤其是关于环境损害赔偿制度的建设,各地纷纷出台文件政策加以规定,但都收效欠佳。究其原因,是因为环境损害赔偿金的理论建设缺位,其归属、管理
近年来我国金融市场发展速度加快,越来越多的理财产品出现在人们的视野里,结构化理财产品因其灵活性、多样性、复杂性等特征成为理财市场的热门产品。其中,股指类结构化产品发展迅速,品类丰富这一特征尤为显著。但由于其结构复杂,绝大部分投资者难以理解该类产品的定价过程,无法对该类产品的投资价值进行评判,进而导致无法判断这一产品是否契合个人投资偏好。基于此,本文以招商银行结构化理财产品沪深300看涨鲨鱼鳍的定价
小微企业是国民经济体系中的有机组成部分,在增加就业、推动经济增长等方面具有不可忽视的作用。在市场经济不断前行的道路上,小微企业逐渐获得了金融机构的关注,政府相关部门也陆续出台文件政策扶持小微企业的发展,要求商业银行加大对小微企业的资金支持力度,引导商业银行将更多低成本资金投向小微企业,我国商业银行小微企业贷款出现了转折点。过去,商业银行在贷款业务方面无论从成本、收益、风险等角度都更加倾向于大中型企