基于深度森林的P2P网络借贷违约风险评估

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:wangzuyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络借贷作为“互联网+金融”模式的代表,为借款方和投资方打通了一条便捷的融资渠道,但伴随P2P网络借贷行业的迅速发展,P2P网络借贷违约事件频繁出现,导致大量P2P网络借贷平台破产倒闭。这不仅损害了投资方的合法权益,同时也危害了互联网金融行业的安全与社会的稳定。针对现有的机器学习算法在违约风险评估中的预测准确率、F1值和AUC值不高的问题,本文使用深度森林算法构建P2P网络借贷违约风险评估模型。论文主要工作如下:(1)数据预处理与特征选择。本文以Lending Club平台的历史借贷交易数据集为研究对象,首先对原始数据集进行清洗,然后确定数据集的目标变量和特征变量,将目标变量分为违约类和履约类。其次将特征变量分为连续型特征变量和离散型特征变量,对连续型特征变量进行了归一化处理,对离散型特征变量分为有序离散型特征变量和无序离散型特征变量,对有序离散型特征变量进行自然数编码和归一化,对无序离散型特征变量进行独热编码。最后使用了方差和互信息指标进行特征选择。(2)建立基于深度森林的P2P网络借贷违约风险评估模型。本文选取了梯度提升决策树、随机森林、极端梯度提升决策树和极端随机森林作为学习器构建深度森林,每一层的学习器接收原始特征信息和上一层输出的特征信息,并将处理结果输出到下一层。模型的输入是数据预处理和特征选择后的P2P网络借贷数据,输出是借款人为违约类的概率。(3)风险评估模型的对比与分析。本文选取了逻辑回归、线性判别分析、决策树、K近邻、朴素贝叶斯、BP神经网络和Adaboost集成决策树与深度森林进行模型对比实验。实验结果显示,深度森林模型的F1值为0.6790、准确率为0.6824和AUC值为0.7579,相比逻辑回归、线性判别分析、决策树、K近邻、朴素贝叶斯、BP神经网络和Adaboost集成决策树,深度森林模型在P2P网络借贷违约风险评估中具有更好的预测性能。
其他文献
目的通过分析文化遗产在严肃游戏中应用的目的、玩法以及范围,探讨在面向未来的文化遗产教育中,严肃游戏可能发挥的潜力和方向。方法利用严肃游戏的G/P/S分类模型,进行国内外
本文从新课标高中地理教学中实现情感态度价值观的目标出发,结合笔者参加省市优质课评比的一些感悟,积极收集各种素材、寻求多种途径,如充分挖掘和利用教材资源、多媒体资源
随着时代的发展,各矿山企业均争当“绿色矿山,节能矿山”.竖井提升为矿山开采的重要部分,所以竖井提升的提升方案是否经济合理至关重要,而其中的关键就在于提升容器与提升方
介绍了矿山企业普遍采用的功率因数自动补偿控制器的工作原理,论证了输出运行方式变换的必要性、可行性,并介绍了一种简便的改进方法.
海豚是一种有着悠久进化历史的海洋哺乳动物,它们的“语言”系统很发达,相互之间使用哨声进行交流。目前对海豚物种进行分类识别主要依靠视觉观察,然而海豚大部分时间在水下,
本文提出了半刚性连接框架弹塑性地震反应分析模型,并针对半刚性连接框架结构的弹塑性地震位移的实用计算开展研究。在合理选取一定数量的地震记录及典型的结构形式的基础上,基
社区是社会管理基础性的平台,完善社区服务对于社会管理创新意义重大。近年来,许多地方政府实施了以改善社区服务递送为主的社区服务创新政策。然而由于政府提供的社区服务大
高等数学类课程是高校的基础课程,本文针对独立学院的具体情况,结合数学类课程内容的特点,建立适合独立学院的考评体系。
目的:探讨醋酸钠林格氏液在低温暴露下失血性休克猪早期液体复苏分布特点。方法:巴马小型猪24头,雌雄不拘,随机数字法分为4组,分别为羟乙基淀粉(130/0.4)电解质注射液对照组(
以软件工程的方法对杯形件拉深工艺CAD系统进行结构化分析、结构化设计和结构化程序设计。利用该方法编制的CAD系统结构化程度高、通用性强、便于修改和维护。