基于组合模型的个人信用评估研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:html007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪后,个人信用贷款已成为一种极具普及性的国民消费方式。除了传统的商业银行,一些具备相应资质的互联网金融机构也进入该领域,使得我国个人征信市场朝着更加多元的方向发展。目前,个人信用评估的方法主要涉及统计学,运筹学,非参数分析法以及人工智能等领域。随着相关领域研究的深入,基于单一方法的模型已经在行业内被广泛利用。但由于单一模型提升空间有限,使用多种方法融合的组合模型成为了新的研究热点。采用合理的组合方式在一定程度上可以克服单一模型的缺点,还能够使基分类器优势互补。因此本文就个人信用评估问题,对单一模型和组合模型分类效果展开了研究。本文选择了统计方法中的Logistic回归及人工智能算法中的SVM模型作为基分类器。首先对原始数据进行预处理,如采用KNN补齐缺失值,识别并处理异常值以及数据标准化。其次本文利用SMOTE算法对个人信用数据中存在的类不平衡问题进行处理。在实证研究部分,本文利用Kaggle平台提供的个人信用评估项目数据集建立了单一模型以及采用串行和并行两种方式建立了组合模型。组合模型的构建过程中,对SVM算法采用sigmoid转换将决策值以后验概率的形式输出,再与Logistic回归有机结合。本文采用准确率、两类错误率及AUC来衡量模型的效果,用验证集与测试集的分类精度差值评估模型的稳健性。通过实证分析得出,相对于单一模型,组合模型更加具有优势,其中并行组合模型在个人信用评价中效果最佳。对比单一模型,组合模型不仅在总体准确率上略有提升,对将真实为违约样本判定为未违约样本的错误类型得到了较好的控制,此类错误的改善在信用评估有着重要的价值。就单一模型而言,SVM模型的分类效果更好。从稳健性上来看,测试集与验证集整体水平相差不大,单一模型和组合模型都具有较好的泛化能力。其中,SVM模型测试集与训练集的分类准确度相差最大,稳健性略低于其他模型。Logistic回归的稳健性最好。
其他文献
自2000年国际音乐信息检索学术会议创办以来,关于音乐推荐系统的研究层出不穷,越来越多的推荐方法被提出、使用。但音乐推荐系统面临的挑战仍然艰巨,用户反馈数据的稀疏性、歌曲分布的长尾问题等等,都是亟待解决的难题。本论文对混合音乐推荐算法进行了研究,整理了近期混合音乐推荐引文的研究成果,提出了一种深度神经网络混合推荐模型,旨在解决上述问题。通过设置评估实验,对深度神经网络混合推荐模型的模型性能、预测精
随着现代经济的快速发展和我国财务分析体系的完善,对企业的短期偿债能力进行科学的评价分析变得越来越重要。短期偿债就是指利用企业流动资产来偿还到期的短期债务。企业在经营过程中,不能盲目追求企业盈利能力而忽略企业的经营偿债问题,更不能累积过多流动资产而造成闲置资金,使得企业的发展空间没有得到足够的利用。企业应当在保证短期的流动资金足以偿还日常债务的前提下,寻求更好的发展。在这样的情形下,对企业做出短期偿
学生对于老师的课堂教学进行评分是教学评价的常用方法,被广泛运用于各个高校,是考察教学质量的重要手段之一,对于评教数据的分析能有助于发现在教学中暴露的问题,从而有针对性的采取措施,引导教学与实践朝着正确的方向发展。本文采用重庆大学2011-2014级学生考试成绩数据和2011-2017年教学评价数据,分析学生评教分数和学生成绩之间的关系。首先使用方差分析比较不同的课程类型下学生评教的差异情况,发现对
网约车行业是典型的新兴行业,它的发展是伴随着移动互联网的进步以及智能手机的普及而进行的。网约车行业在我国诞生的时间虽然短暂,但其发展势头却不容小觑,如今几乎在我国各城市都能见到其踪影,这一新兴的出行方式也深受公众欢迎,已经发展成为我国客运行业的重要力量,深深地改变了民众的出行理念和出行习惯。但是在网约车行业的发展过程中,层出不穷的网约车侵权事件成为了社会关注的热点问题,与此同时,在网约车侵权事件中
伴随着互联网的快速发展,网络招聘平台成为获取招聘信息主要的途径。本文以人工智能行业岗位为例,对该岗位在全国范围内的线上招聘信息进行研究。本文的数据选取为前程无忧网站人工智能岗位的招聘信息,对于招聘信息中的结构型数据主要进行描述性分析,从而获得该行业相关岗位的基本概况;然后对图像处理、语音识别、无人驾驶三个岗位类别招聘信息进行分析挖掘。最后对招聘数据中的不同水平之间进行关联分析,挖掘不同水平之间的内
随着科学技术的不断发展,我们已踏入了“大数据”时代的大门,各种数据信息层出不穷,我们每天都在主动或被动的不断获取着关于这个世界所带给我们的方方面面的信息,在这一信息过载甚至信息爆炸的社会中,人们真正所需要的、所感兴趣的内容和信息的海洋相比也显得九牛一毛,在这种情况下,我们如果要在浩瀚的信息中搜寻到真正想要的内容往往要借助搜索引擎带给我们的帮助(百度、Google等)。但使用搜索引擎有一个不可避免的
近年来,深度神经网络通过增加模型的深度来提高特征提取和数据拟合的能力。与浅层模型相比,它在图像处理方面表现出了很大的优势,例如图像分类,图像识别,图像分割等,为图像超分辨率重建和黑白图像着色提供了新的途径,尤其是生成式对抗网络通过生成模型和判别模型对抗来达到对生成图片最大相似度的伪装,使得图像到图像间的生成和转换到达几乎无法分辨的地步。针对图像超分辨率重建和黑白图像着色研究,如何提高图像特征的利用
随着国务院“全民健身计划纲要”和“全民健身条例”的颁布实施,全民健身活动广泛开展,我国体育事业发展速度显著提高。学校体育作为我国体育事业的主要构成部分,是我国体育运动向全民推广和普及的良好载体之一。高校作为培养及输送各类人才的摇篮,在国家体育事业开展及培养德智体美劳均衡发展人才发挥重要作用。民办高校是我国高等教育的重要构成部分,对推广和落实全民健身国家战略计划也发挥重要作用。健美操运动因其独有的项
智能化社会是大势所趋,图像分割作为计算机视觉领域的基础性工作之一,一直都是相关领域研究的重点和热点。由于神经网络强大的拟合能力,很多基于监督学习的神经网络图像分割模型被提出。但是在监督学习中需要大量的标注样本,且需要提前训练模型的缺陷,无监督神经网络分割模型逐渐受到关注。为解决以往模型未能较好地解决分割同一目标具有显著颜色差异时,难以将其分为一体的问题,本文首先大量调试SLIC算法和felzens
当前,我国农业农村现代化仍然面临着严峻形势,十九大提出的乡村振兴战略是从根本上突破这一困境的关键,战略指出:加快农业现代化步伐,促进小农户生产和现代农业发展有机衔接。2019年中央一号文件将小农户融入现代农业发展的政策进一步落实,通过“农户+公司”、“农户+合作社”的模式带动农户共同发展。大力发展农户与经营组织合作、合作组织之间联合经营是培育现代农业经营主体理论研究和实践探索的重要内容。近几年来,