数据挖掘组合模型在个人信用风险评估中的应用

来源 :首都经济贸易大学 | 被引量 : 9次 | 上传用户:tangwang1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个人消费信贷的快速发展,国内个人信用卡的使用正表现出与日俱增的趋势,越来越多的人们认识到信用贷款的便捷与好处,更有走在前端的金融人士将信用贷款作为一种投资手段加以利用,那么为了快速而有效地对他们进行个人信用风险评估和预测,越来越多的相关业务部门开始需要利用数学挖掘等科学高效的技术来实现用户的评估和评价。本文以Lending Club公司个人消费信贷数据为基础,将数据挖掘技术应用于P2P信贷领域。在进行了相关的理论分析后,本文对数据进行了大量的基础处理,如数据转换、缺失值处理、数据整合及数据标准化等,从根本上保证数据的正确性、一致性、完整性和可靠性。文章随后对借款人进行了用户画像,从描述性统计上首先掌握了借款人的相关信息。之后根据标准化后的整齐数据框,建立了单一预测模型,包括logistic回归模型和人工神经网络模型,在模型建立过程中对它们进行优化,达到了最好的单一模型预测结果。然后通过随机森林的训练来挑选出借款人的有效预测变量,剔除冗余指标对预测结果的干扰,加上Logistic回归的输出结果(即概率值)作为新增的重要变量,共同作为人工神经网络模型的输入端变量建立了组合模型。经验证,组合模型比单一模型的准确率更高,稳定性更强,可解释性更优良。最后,本文对分析过程中存在的一些潜在问题进行了剖析,并对后续的工作进行了展望。本文的最终目的在于利用国外已经相对成熟的P2P网贷经营模式下产生的借款人画像来建立有效的风险评估模型,推动建设国内的个人信用风险评估体系,以期为个人消费信贷这类商业实践提供一定的技术支持。
其他文献
水体中氨氮超标时,会对人类造成巨大的威胁,故其是环境监测的常规指标。探讨了一种水体中氨氮的现场快速分析方法,结果显示,此方法标准曲线较稳定,测定结果较为精密、准确、可靠,可与标准方法比拟,同时可将水样沉淀絮凝后取上清液直接测定,大大缩短了分析时间,且携带方便,完全满足水中氨氮现场分析的要求。
随着信息技术的迅速发展,近年来.多媒体现代化教学手段已渐渐渗透到学前教育当中。首先.在教师成长方面.起到了推波助澜的作用.使教师整体素质得到较大提高。其次.在辅助幼儿教育教
目的:实习护生通过临床实习掌握专科技能和知识。方法:每轮护生入科后首先由教学组长介绍科室的基本情况,然后安排给各位带教老师专人带教。带教过程中做到放手不放眼的原则,理论
对机电一体化系统设计课程特点进行分析,并提出机电一体化系统设计课程教学中存在的难点问题。在此基础上,对机电一体化系统设计课程教学改进措施进行探讨。该课程教学改进措
综述了我国聚丙烯酰胺行业的产业化进展和市场情况,汇总分析了近年来国内聚丙烯酰胺行业的消费结构和供需关系等。指出我国聚丙烯酰胺行业消费量将保持稳定的增长趋势;用于水
<正>《初中数学教与学》2015年第10期陈林香老师《求解线段最值问题的常用方法》中,提供了运用构造三角形求线段最值问题的方法,笔者也提供一种构造辅助圆求解线段最值的方法
<正>引例如图1,在平面直角坐标系中,抛物线y=—2/3x~2—4/3x+2与x轴交于B、C两点(点B在点C的左侧),与y轴交于点A,抛物线的顶点为D.点P是线段BC上的动点(点P不与点B、C重合),
住是人类最基本的需求之一。十九大报告中明确提出:"让全体人民住有所居"。在新时代脱贫攻坚过程中,保障贫困人口的住房需求也是全面建成小康社会的重要要求。由政府主导建立
我科于2008年7月~2009年12月采用恩度联合化疗治疗32例晚期恶性肿瘤患者,经过精心护理,取得满意效果。现将护理体会报告如下。
项目化教学是连锁经营课程教学改革的重要模式,本文以校企协同创新为视角,认为项目化教学必须突破参与主体间的壁垒,借助岗位和技能“双需求”,明确教学职业能力目标,并以岗