论文部分内容阅读
目前,居民生活水平的提高,提前消费理念的日益普及,信用卡发卡量再次进入了快速增长期。对于商业银行而言,这既是机会也是挑战。面对信用卡发卡量的激增,商业银行不仅拥有了更多的生息资本和利息收入,同时也面临着日益增长的信用风险。如何快速和准确地评估申请用户个人信用风险,已经成为商业银行风险控制的核心环节。随着个人信用风险评估研究的不断深入,各类统计学和机器学习模型纷纷投入生产。但大数据时代的到来,给传统的个人信用风险评估模型带来了新的发展空间。量级增长的数据在提供丰富信息的同时,也给评估模型的构建求解增加了难度。深度学习优秀的特征学习能力突显出来,它在信用风险评估领域的应用逐渐成为一个值得探索的问题。深度信念网络性能优秀,但需花费较长的训练时间;而极限学习机具有训练速度快的优点;有效结合两个模型的优点,使其在个人信用风险评估中表现优异是本文的探索方向之一。本文针对个人信用风险评估中存在的样本极不平衡问题,尝试采用基于聚类的融合采样方式(K-BSMOTE)进行数据平衡化。本文实证建立在真实数据集上,分别采用传统的逻辑回归、梯度上升决策树与深度信念网络的极限学习机模型进行建模评估。逻辑回归实证结果认为低学历、没有稳定住所的年轻男性违约风险较高。梯度上升决策树的变量重要性排名显示,行内资产的相关变量相比个人基本信息类变量的得分更高。从模型性能角度来看,可以认为数据平衡化方案在一定程度上能够提升模型性能,而就整体而言,基于深度信念网络的极限学习机模型的表现则略优于逻辑回归和梯度提升决策树。