大数据下的个人信用评估研究

来源 :海南大学 | 被引量 : 1次 | 上传用户:shmilygang8751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用评分是金融机构进行授信决策的基础。随着科技的发展,大数据技术已渗透进金融领域,个人征信进入新时代。大数据下的个人信用评估是目前研究的热点之一,本文基于个人信贷数据进行了全面的实验研究。个人信贷数据高维度的特点增加了实验难度。为了更好的获取样本数据,降低数据维度,本文研究了特征选择算法:随机森林、Pearson相关系数以及距离相关系数,在此基础上结合特征相关的热力分布图,对数据特征的相关性进行优化,创造性的提出了Pdc-RF算法。进一步地,本文对Pdc-RF算法的性能进行了仿真检验,对比传统特征选择算法Pdc-RF算法表现出更佳的性能。具体针对个人信贷数据信用评估这一具体应用场景,对实验数据集进行数据清洗,对离散数据进行了one-hot编码,随之进行了全部数据特征的标准化处理。基于Pdc-RF算法完成个人信用数据的特征选择,将145维的数据降低至22维。在此基础上,对降维后的数据进行了统计学方面的探索性分析。在完成数据的预处理以及特征降维处理的基础上,本文完整搭建了个人信用评估模型的评分卡模型。建模过程中,首先进行了数据分区,对实验数据进行了WOE编码转化和IV值的计算。为了获得最佳的评估模型,本文基于逻辑回归,随机森林以及SVM支持向量机三种机器学习算法进行训练,经过超参数的调整和性能对比,选择了AUC和K-S值均最高的逻辑回归模型。最终,本文根据逻辑回归模型输出的预测结果,给出基于信贷用户特征的评分卡模型。
其他文献
随着我国市场经济的深入发展,商用车已经迅速取代人推马拉的老式运输方式,汽车的发展大大促进了运输行业和经济的腾飞。商用车一般会采取承载能力更高的整体式后桥的驱动结构
职业教育中的教学评价体系是否科学、合理以及有效,对教师教学质量的监督及技能型人才质量的优劣都会起到积极的诊断、反馈、促进以及指导作用。学生学业综合评价体系是整个
介绍了一种新型的用气源净化装置的设计,制造及情况,解决了在沙漠地区钻机气路上的一些问题,说明该装置具有较高的可靠性和显著的节能效果,同时也是其它陆用钻机,尤其是电驱动钻机
连分数是度量数论、Diophantine逼近理论中一个十分重要的领域,其基本区间的长度在相关度量理论、维数研究中起到十分重要的作用.本文给出了连分数展式基本区间长度的比较关系.
运用变分方法和临界点攀论毋究一类带有P~Laplacian算子的Dirichlet边值问题弱解的存在性.
本文讨论食物受限人口模型中的一个非线性延迟微分方程数值解的振动性.通过应用两种θ-方法,即线性θ-方法和单腿θ-方法,构造指数θ-方法,得到数值解振动的条件,进一步考虑
简要介绍了管柱伸缩器的结构,工作原理及用途。通过分析和计算详细平衡塞在管柱伸缩器设计中的作用,只有平衡尺寸进行合理设计才能够保证管柱伸缩器的有效行程,充分发挥其管柱补
已有的二层信用支付的库存模型忽略了顾客的个体特征.在实际销售过程中,零售商常根据顾客的需求量不同实行不同的销售策略.为研究零售商根据顾客的年需求量不同给予不同的信用期
碳化硅(Silicon Carbide,SiC)因其禁带宽度大、击穿电场强、饱和速率高和热导率高等物理特性,在半导体材料中占据主导地位。因此,SiC MOSFET具有高频、高压、耐高温、高功率
4株不同毒力鸡传染性法氏囊病(IBD)活疫苗,分别接种30dSPF公维,4d后再接种鸡新城(ND)Lasota系活疫苗,同时每组捕杀5只,观察法氏囊损伤情况,另4组用同1天的SPF公无接种ND-Lasotq系疫苗4天后再接种不同毒力的IBD疫苗。试验结果表