基于选择性集成算法的网贷个人信用评分模型研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:wudidewohaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着小额消费信贷和互联网金融的发展,P2P网贷行业迅猛发展,已达万亿市场,网贷平台无需抵押,供借款人发布借款标及理财者投资,目前个人信用观念极弱,信息不对称、逆向选择导致的违约情况严重,因此,网贷信用评价至关重要,信用评分旨在利用个人信用相关数据对是否违约进行判断,提前预测借贷者的信用情况,决定是否借款,可以减少平台的违约率,也能促进国民信用意识的提高。然而网贷个人评价指标体系不够完善,特别是互联网金融信息、社交信息没有考虑在内,另外评价模型准确性及稳定性有待提高。目前以数理统计、人工智能方法(神经网络、随机森林、SVM)为基础的单一模型、集成模型存在着诸多问题,包括误判率高、不稳定、泛化能力弱、计算所需空间和成本高。针对上面提到的问题,本文提出评分模型系统性优化方案,重点进行指标体系的完善及评分模型的构建优化。其一,首先梳理分析传统的个人信用评价指标体系,初步构建符合网贷特点的指标体系,再基于逻辑回归方法,计算指标的WOE、IV值,进行显著性分析,科学合理的确定指标体系。其二,构建基于选择性集成方法的模型,首先选择准确率达标的分类器,计算Q统计差异量,确定最终的基分类器,然后引入选择性集成算法,异构一定数量的分类器集,选择最优的子集集成模型,构建基于方向排序法选择性集成模型(OO)、基于模糊聚类分簇法选择性集成模型(FCM-CFP),其三,最后利用融360平台、人人贷的数据进行实验,从准确率、基分类器规模、计算时间三个维度对两个模型进行比较分析,另外也与单一模型和集成模型进行对比分析。实验结果表明,两个模型各有优劣势。选择性集成模型预测性能都最好、排序法模型计算时间更短,分簇法由于保持更好的差异性,稳定性更好。上述两个模型与单一模型、集成模型相比,基分类器数量较多,但评分精度,稳定性、泛化性能更高。
其他文献
针对食用菌菌汤加工贮藏过程中易分层的问题,研究了单甘酯、十二烷基硫酸钠、Tween80、Span60等乳化剂对食用菌菌汤的乳化效果,得到了适宜的复合乳化剂配方。研究结果表明不同
模糊限制语作为促进交流顺利进行的方式之一,其在日常会话中的使用受到关注。实际上,不仅是日常会话,模糊限制语也被广泛使用于外交语言中。但是和中英两语言相比,有关中日模糊限制语的对比研究还不充分。因此,本文聚焦于外交部例行记者会中的模糊限制语,为了揭示中日外交部发言人对模糊限制语的使用情况,分别对其发言人的发言记录进行考察,进一步揭示出中日外交部发言人在模糊限制语使用上的异同点。首先,整体上外交部发言
全面预算是现代企业管理的重要手段之一,然而我国很多企业所实施的全面预算存在很大的缺陷,有些企业的全面预算甚至是形同虚设,这不仅削弱了全面预算的资源配置与流程优化作用,而且导致企业无法实现自身的战略目标。平衡记分卡是一种平衡了财务角度、客户角度、内部流程角度以及创新与学习角度的,对企业进行全方位管理的管理方法。具体而言,平衡记分卡细化了企业战略,促进了企业实现短期业绩与长期目标、内部经营与外部环境、
期刊
<正>出版社:华语教学出版社出版时间:2014年1月"当代中国微记录"丛书以平民的视角、平实的语言和家长里短的故事,将当今中国的各个侧面展现在外国读者面前,读者可以边学汉语
会议
(目的)疥螨(Sarcoptes scabiei)是一种重要的人兽共患寄生虫病,目前尚缺乏有效的血清学诊断方法,本研究旨在探讨重组疥螨丝切蛋白的诊断价值。(方法)根据GenBank中疥螨丝切蛋
会议
期刊
综述了80年代以来我国硫磺回收技术的进步。总结屯靠科学管理,技术改造,开发了现有生产装置的经验和引进国外先进技术取得的成绩。介绍了在开发系列硫磺回收及尾气处理催化剂,自控
以江山白菇(F21)为育种亲本材料,经系统选育,育成高产、优质、抗逆性强的白色金针菇新品种—江山白菇(F21-2),菌丝生长温度3℃~33℃,原基分化温度4℃~24℃,子实体正常生长温度5℃~22
朗读是小学语文教学的重要组成部分,对学生的表达能力以及综合语文素养的提升,都起到重要的作用。提高学生的语言表达能力意义重大,就小学语文教学中对学生进行朗读训练展开论述