信用评分系统的设计与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:q1104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济快速稳定的发展,互联网金融信贷业务的发展也来到了高潮。客户数据爆发式增长,传统依靠专家型数据分析的结果缺乏可靠性、准确性以及对海量数据处理效率缓慢,无法有效的挖掘出数据的价值等缺陷日益突出。如何更好挖掘出用户信贷数据,购物数据中蕴含的信息对客户的信用进行定级以减少坏账的发生,同时对客户准确分类以做到更好的互联网金融风控成为了重要的研究方向。由于金融行业的特殊性,为了降低开发评分卡模型的门槛以及提高建模效率,应该有一套信用评分系统能够完成信用评分模型的构建。针对上述问题和需求,通过查询和阅读相关文献对信用评分系统进行深入研究,改进了卡方分箱法分箱后WOE不单调以及某个分箱中样本占比过多等问题;使用基于IV值、皮尔逊相关系数、假设检验、逐步回归等方法挑选入模变量解决了互联网高维特征难以挑选的问题;对Spark技术框架进行深入研究,实现了一个信用评分系统,该系统由资源管理模块、模型构建模块、可视化模块三大模块构成。其中资源管理模块由数据资源管理、模型管理、任务流程管理构成。其主要负责数据的上传下载、模型的存储和删除、任务的查找和删除等;模型构建模块由功能组件和算法组件构成。其中功能组件内部封装了数据处理逻辑,算法组件内封装了逻辑回归算法,其主要功能负责模型拟合前的特征处理以及之后的模型训练;可视化模块分为数据可视化和流程可视化两部分。其中数据可视化负责中间数据以及模型评估结果的展示,流程可视化负责整个建模流程的展示。本文使用国内某互联网消费金融公司的人行征信数据构建信用评分模型,通过使用改进的卡方分箱方法进行特征分箱然后使用逻辑回归算法进行拟合后,AUC和KS两个指标都得到了提升,其中AUC从0.7267提升到0.7373,KS从0.339提升到0.353。信用评分模型通过组件的方式进行构建并运行在信用评分系统中,通过该信用评分系统降低了构建信用评分模型的门槛以及提高了构建信用评分模型的效率。
其他文献
目的利用磁共振成像(MRI)参数建立乳腺良恶性病变的鉴别诊断模型,提高乳腺病变性质的诊断水平。方法对116个乳腺病变行常规MRI和动态增强MRI(DCE-MRI)检查,比较良、恶性病变的形态
目的:本研究拟将柠檬汁与氧气一起雾化后吸入以防治术后恶心呕吐.通过空白对照以及临床常用药物(昂丹司琼、甲氧氯普胺)的对照实验,以了解柠檬气雾剂的疗效;通过与传统的嗅柠檬
目的:持续性房颤和阵发性房颤有不同的房颤负荷,本文旨在探讨不同房颤负荷合并心力衰竭老年患者预后危险因素的相关性。方法:检索2017年10月至2019年1月于重庆医科大学附属第一医院老年病科及心内科住院明确诊断房颤合并心衰的164例老年患者纳入本研究。收集其临床资料,主要包括患者的一般情况、房颤类型、NYHA分级、伴随疾病、血红蛋白、总胆红素、直接胆红素、肌酐、eGFR、甘油三酯、总胆固醇、NT-p
教学设计是对外汉语教学中的关键环节,它体现了教师对课文的理解程度和教师的设计理念。教师要通过自己的课堂教学提高学生的汉语表达能力,完成教学目的,达到最好的教学效果,所以教师在开展教学之前需要对所有的教学环节都要进行设计,从而吸引学生的注意力,促使他们积极地学习,取得更好的学习成绩。《博雅汉语》这本书是由钱旭菁、黄立主编,其中第七课的内容是《今天都在送什么?》,这一课程内容是汉语综合课。本节课的主要
目的 探讨来曲唑与克罗米芬对内分泌失调性不孕症子宫内膜厚度的影响及疗效.方法 随机选取2011年3月至2014年10月本院收治的内分泌失调性不孕症患者80例,依据治疗方法将这些
目的通过对比支气管哮喘老年患者合并阻塞性睡眠呼吸暂停低通气综合征的临床资料及肺功能指标,来探讨哮喘合并OSAHS的危险因素,为临床诊治提供依据。方法研究对象病例选取均来
目的:探究超声引导下空心针穿刺活检对乳腺癌诊断的应用价值。方法:对本院2016年1月至2018年10月间收治的80例存在乳腺肿块疑似乳腺癌患者进行研究,80例均接受超声引导下空心
Petroleum Independent,中文刊名《独立石油》,由美国Independent Petroleum出版公司发行。创刊于1931年,国际标准刊号:ISSN0747-2528,全年6期。刊载美国各州石油和天然气的勘探、
期刊
从国内清洁汽油燃料需求和催化裂化过程降低汽油烯烃反应原理出发,系统论述了国内外降烯烃FCC催化剂的研究开发现状及技术发展方向,指出未来降烯烃FCC催化剂将朝着突出重油裂
介绍了兰州石化公司乙烯装置废碱单元低压湿式空气氧化工艺的运行情况,并对影响装置长周期运转的因素进行了分析,包括反应温度、反应压力、空气用量和废碱液中油含量等.生产