基于混合NGBoost的互联网金融违约预测研究 ——以Lending Club平台为例

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:lsh123456lsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近期来,信息科学搭乘互联网科技的快车,给各大行业带来新的发展机遇,新的行业发展态势也如雨后春笋般涌现。在大数据分析技术、云存储技术、人工智能技术等的驱动下,金融行业的全新模式--互联网金融的概念应运而生的。行业新模式的出现,往往机遇与挑战并存。一方面,信息技术有助于打破传统金融领域信息不对称的壁垒,大幅减少交易成本,促进金融市场的高效化、阳光化和规范化,提高金融包容(financial inclusiveness)水平。这对于健全我国多层次金融市场方面有着巨大贡献,对我国金融行业的发展、经济模式的良性运转具有积极意义。另一方面,这样创新的模式也对金融行业的科学控管提出了新的要求。金融要想抓住历史发展机遇,合理管控风险,就必须提高行业自身的管理水平。高新信息技术和金融行业的结合,使得用户欺诈行为更具隐蔽性。因此,如何快速准确地识别这些金融欺诈行为,成为了互联网金融时代亟需解决的难题。本文立足于互联网金融行业的新态势,基于互联网金融数据分布不平衡的特点,创新性地将机器学习方法和互联网金融数据进行融合,设计了一套用于识别风险用户的违约预测模型,并通过实证研究证明了其有效性和普适性。更进一步地,本文从特征工程、模型选择以及影响因素的角度对互联网金融行业的未来发展方向提出了建议。本文首先就互联网金融行业内的违约预测的相关研究结论进行了文献调研,着重对违约风险紧密关联的影响因素进行了梳理归纳。在预警模型构建方面,本文在传统预警模型的基础上,针对性地引入非平衡数据处理方法,并进行多模型融合实验。本文基于Lending Club平台的金融数据进行实证研究发现,从数据角度进行非平衡处理以及从模型的角度进行多模型融合,对模型的预测效果均有积极作用。全文分为五个部分:第一部分为本文的引论部分,阐述了本文的选题背景和意义,并对国内外的相关领域进行文献调研,对其成果进行归纳、总结以及综述。第二部分,对本文涉及到的关键概念的内涵进行了界定,对这些概念的外沿及其关系进行说明,并从借款人以及借款行为的角度,对互联网金融行业的违约影响因素进行梳理总结。同时引出了本文的主要研究方法的理论依据,基于Boosting集成学习的机器学习理论以及基于重采样算法的数据预处理理论。文章的第三部分,介绍了本文实证研究的数据来源。具体地,本部分对300多万条数据进行了缺失值处理、特征选择以及数据平衡化操作。第四部分,实证研究,本部分基于NGBoost、XGBoost、Ada Boost、GBDT分别构建违约风险预测模型,并分别与SMOTE、LR-SMOTE、Tomek Links、CMFS-LR-SMOTE、Easy Ensemble非平衡数据处理方法进行融合。实证研究的结果表明,NGBoost在单模型中表现出最佳的性能,而与CMFS-LR-SMOTE的结合,可以进一步提高模型的预测能力。第五部分,基于上述研究的结果,本文得到如下结论:(1)NGBoost和其他算法相比,预测效果最佳;(2)特征工程和算法融合可以提升算法的上限;(3)借贷者的信用等级是做重要的影响因素。
其他文献
学位
本研究从素养视角解析深度学习内涵与结构,考察中小学生的学习情境,形成问卷测试条目。对683名中小学生进行问卷数据的项目分析和探索性因素分析,对669名中小学生进行问卷数据的验证性因素分析,结果发现:中小学生深度学习问卷是一个三维度九指标结构,分别是深度投入(活力、奉献、专注)、深入认知(关联策略、整合策略、反思策略)、深层结果(理解与迁移能力、批判与创造能力、协作与沟通能力),共计37个条目。通过
针对传统无线电能传输系统原边整流级和逆变级之间采用电解电容,使系统成本高、体积大、功率密度低,以及副边不控整流和DC/DC变换器的组合增加了系统的成本、体积、和复杂性等问题,提出了一种改进的无线电能传输系统,去掉了原边整流级和逆变级之间的电解电容,副边采用半有源整流器来代替不控整流和DC/DC变换器的组合,减少了无功元件和开关器件的使用,简化了系统结构,节约了成本,提高了功率密度。通过对系统进行数
<正>马英九上台以来所推动的两岸交流和其对外政策备受瞩目,在其决策的背后,有一个深谙两岸经济与对外事务的智囊团。台湾《新新闻》杂志10月份一篇题为"三大智库,马英九的军师团"的文章向外界掀开了它们的面纱。
期刊
将虚拟同步运行的混合储能装置与同步发电机通过虚拟轴耦合,可实现暂态能量的高效传递,提高可再生能源发电系统的暂态稳定性。建立了混合储能装置静态能量与同步发电机动能之间的转换关系。对混合储能装置中的虚拟惯量进行分析,以获得同步运行能力。为了从同步发电机中传递更多的暂态能量,在混合储能装置中引入新的虚拟轴,并分析混合储能装置与虚拟轴耦合对系统暂态稳定性的影响。利用哈密顿能量函数,推导混合储能装置暂态能量
本文主要根据蛋鸡不同生长发育阶段的生长特点、营养需求和饲养管理条件,进行总结分析蛋鸡饲养管理技术要点,希望为蛋鸡饲养场提供理论和技术支持。
新时代大学生感恩教育是高校思想道德教育中的重要组成部分,其价值意蕴体现为增强道德感召力、达成情感共鸣和塑造社会责任感。当前,高校感恩教育存在大学生漠视亲情、淡忘恩情、忽视社会责任等多重困境。高校要以传统的感恩思想为基础,探索丰富的感恩思想资源;以思想政治理论为抓手,促进大学生形成对感恩的理性认知;以塑造感恩的校园文化为依托,为实施感恩教育提供活动载体,全面深入地推进感恩教育。
针对现有电流源并网逆变器与弱电网之间的交互稳定性以及新能源高渗透率带来的系统低惯量问题,提出在单一电流源逆变器系统中加入一定比例的虚拟同步机(VSG)运行。分别对混合系统中加入电压源型和电流源型VSG的容量占比与短路比(SCR)稳定域的关系进行了研究,加入电压源型VSG的系统SCR稳定域随VSG容量增大而增大,而加入电流源型VSG的系统SCR稳定域随VSG容量增大而减小。由此提出在单一电流源逆变器
目的 分析重度牙周炎患者牙齿牙髓治疗时机和牙周牙髓联合治疗的效果。方法 选择2021年01月-2021年12月收治的重度牙周炎总共86例患者开展研究,依据随机数字表法分成对照组(仅开展牙周治疗)和观察组(开展牙周牙髓联合治疗)分别包含43例,比较两组治疗前后的视觉模拟评分(VAS)得分;治疗前后的牙周袋深度(PD)、龈沟出血指数(SBI)、牙齿松动度(PTV)得分及菌斑指数(PLI)等牙周状态指标