随机森林在个人信用评估中的应用研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:helen_shen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,国家信贷政策的陆续出台以及受到西方文化一定程度的影响,人们的消费观念逐步转变,随之而来的是我国个人消费信贷在规模上越来越大,在范围上越来越广,包括个人住房贷款、个人日用消费品贷款、3C产品贷款、个人旅游贷款等业务都呈现急速增长态势。尤其是互联网金融的兴起,更是将信用消费推向新的高度。然而,我国个人信用体制不健全、商业银行等信贷机构消费贷款风险管理制度较落后,这些都导致个人消费信贷业务在发展向好的同时却出现了不少问题,增加了商业银行等机构的信用风险。在这样的背景下,研究如何制定一个科学合理的个人信用评估指标体系以及搭建可靠的个人信用评估模型,对于我国个人信贷业务更加良性的发展便具有非常重要的现实意义。随机森林是一种优秀的数据挖掘方法,其预测准确率高、可以处理高维数据、不容易过拟合、训练速度快等优点使其在很多领域都有广泛的应用,包括文本分析、图像处理、基因组学数据分析、客户流失预测等等。可以预见随机森林的这些优点使其同样适合应用在个人信用评估中。本文以个人信用评估作为研究对象,首先对其进行文献综述,并综合各家对于个人信用评估指标体系的观点总结出个人信用指标体系构建原则进而据此对个人信用评估指标进行分类,包括个人指标、经济指标、信用指标这三个大类指标;其次,从定义、算法、理论基础等方面介绍了随机森林,总结其优点及相关应用,为之后的模型构建做好理论铺垫;然后对信贷数据集German Credit Dataset经过数据预处理与数据集划分后,建立基于随机森林的个人信用评估模型,通过调整参数ntree、mtry进一步优化模型,并引入ROC曲线对模型进行评估;最后,从准确率与稳定性的角度对随机森林、Logistic回归与支持向量机三个模型进行对比,结果显示,在多次数据验证的情况下,无论是准确率还是稳定性,随机森林相比另外两种模型都略胜一筹,这肯定了随机森林在个人信用评估中的适用性,同时通过OOB数据对特征重要性进行评价,进而给银行信贷管理工作提出更有针对性的意见。
其他文献
对于大数据时代,目前人们所讨论的数据几乎都是条数据,条数据是指某个行业或领域呈链条状串起来的数据,他们彼此割裂、互不融通,限制了大数据在经济社会发挥作用。$$ 与之相比
报纸
目的探讨女性盆腔囊腺瘤(癌)多排螺旋CT表现与鉴别诊断。方法回顾性分析江苏省泗洪县人民医院经手术、病理证实的女性盆腔囊腺瘤(癌)28例多排螺旋CT影像特点。结果 28例患者,囊腺
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
加强非物质文化遗产档案管理工作,是保护和抢救非物质文化遗产、继承和发扬传统民族民间文化的重要举措,全国各级档案部门应以开展非物质文化遗产保护工作为契机,切实做好非
采用动态因子分析方法,选取2008-2012年6项旅游指标,从纵向角度和横向角度对我国珠江三角洲进行综合评价,外对珠三角各市进一步地提升旅游竞争力进行了研究。结果表明:就纵向变化
通过分光光度法测定不同pH值体系下果蔬中LOX酶活的变化,确定了番茄、黄瓜、黑莓、甜瓜、青苹果中LOX酶活测定的最适pH值分别为6.0、7.0、7.0、7.0、6.5。结果表明,反应体系
目前,世界上广为使用的双箱吊具有3种,即BRROMMA双箱吊具、RAM双箱吊具和STINIS双箱吊具.2000年,天津港集装箱码头有限公司在利用世行贷款引进的3台集装箱岸桥上首次采用RAM
2009年5月22日,西伯瑞中国(SIBRECHINA)在天津经济技术开发区举行10周年庆典暨风电制动器新工厂开业典礼。
首先对区域经济协同发展进行了概述,随后分析了交通运输在区域经济协调发展中作用,重点探讨了解决交通运输与区域经济协调发展的对策,包括积极发挥市场的调节作用、积极发挥
目的:探讨银质针导热联合中药熏蒸治疗膝骨关节炎的疗效。方法选取2011年6月~2013年3月湖北省中山医院收治的膝骨关节炎患者56例,随机分为B组(n=27)和Y组(n=29)。B组予膝周痛点阻滞