基于Kolmogorov-Smirnov统计量的信用评分模型选择方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yulequ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用评分系统在商业、金融、工程和健康等许多领域具有重要意义,如何建立简单有效的信用评分模型是信用评分领域的重要课题,但是信用评分模型中常常存在一些冗余变量,需要对变量进行选择才能给出更优的结果,这就引出了另一个重要课题,即信用评分模型的模型选择方法,旨在针对特定的信用评分方法给出变量选择的准则,本文的主要目的在于研究一种新的信用评分模型的模型选择方法,并给出相应的理论性质。Kolmogorov-Smirnov(KS)统计量是一种常用的评估信用评分方法的指标,而Directly Maximizes the Kolmogorov-Smirnov(DMKS)是一种首次将KS统计量作为目标函数进行优化的信用评分方法。和其他信用评分方法一样,DMKS方法也存在变量冗余的问题,为克服这个问题,本文提出了一种基于DMKS信用评分方法以及交叉验证的模型选择方法,用于选择具有合适特征的信用评分模型,并且证明了该模型选择方法在理论上具有渐近最优性,即该模型选择方法得到的参数对应的KS统计量,相对于候选模型集合中所有参数估计对应的KS统计量,在渐近意义下是最优的。另外,考虑到基于交叉验证的模型选择方法往往计算量大,速度较慢,本文使用Iterative Marginal Optimization(IMO)算法加速了模型选择准则的计算,使得本文所提模型选择方法可以适用于样本量较大的情形,该算法同样被用于DMKS方法中;同时利用前向变量选择方法的思想进一步地减少了本文所提模型选择方法的计算,从而加快了选取具有合适特征的信用评分模型的速度。模拟数据和实际数据分析表明了所提模型选择方法的有效性。
其他文献
为了准确预测空气质量,结合实际的天气污染情况,在WRF-CMAQ等一次预报模型的基础上,利用神经网络、机器学习方法中的LSTM算法以及线性学习方法,针对大量的数据进行二次数学建模来提升预测的准确性,同时解决了对现实中存在数据不全导致无法预测的问题.根据预测数据和实际数据对比,建立的空气质量预测模型预测出的数据与真实值的误差均在2%以内.
<正>近年来,我国突发公共卫生事件频繁发生,其破坏性、突发性、不可预知性及后果严重性受到了普遍关注。为加强突发公共卫生事件的有效防控和应急处置,突发公共卫生事件形成的各种档案资料就具有了不可替代的凭证价值和决策依据,并在应对灾难、研究成因、警示后人、记载历史等方面的作用逐渐被人们认知,其重要性日益凸显。因此,加强突发性公共卫生事件档案的建设与管理已成为档案工作者亟待研究、解决的重大课题。一、做好突
期刊
2020年11月16日至17日,中央全面依法治国工作会议正式提出"习近平法治思想",为当前全面推进依法治国、全面推进中国特色社会主义法治体系建设提供了根本遵循与行动指南。宪法是国家根本大法,依法治国首先是依宪治国。党的十八大以来,加强宪法实施、维护宪法权威,始终是党和国家的明确主张,也得到了全社会各方面的坚定支持与热烈拥护。关于宪法的思想是习近平法治思想的重要组成部分。在深入学习与阐释习近平法治思
期刊
目的 对比经尿道1470nm激光前列腺剜除术和经尿道前列腺等离子电切术(transurethral plasma kinetic prostatectomy,TUPKP)治疗良性前列腺增生的疗效及安全性。方法 选择2018年1月至2021年12月湖北省荆门市第二人民医院收治前列腺增生行手术治疗患者760例,根据治疗方法分为TUPKP组441例(采用经尿道前列腺等离子电切术治疗)和剜除组319例(采
小微信贷风险在最近几年逐渐引起了以银行业为代表的金融行业的广泛关注。在供给侧结构性改革的大背景下,国内外宏观经济环境发生了变化,经济结构转型步伐加快,部分行业出现了产能过剩的现象,监管指标中增加了对小微信贷的考核,各种因素给银行业的小微信贷风险管理带来较大的挑战。C银行天津分行是天津地区小微金融的标杆银行,因此对其小微信贷风险管理情况进行研究,能树立很好的典范作用。本文的研究对象是C银行天津分行,
目的:建立不同产地文王一支笔药材的HPLC指纹图谱,并结合化学模式识别技术对其进行质量评价。方法:采用Shim-pack GIS C18色谱柱(250 mm×4.6 mm, 5μm),乙腈-0.2%乙酸水溶液为流动相,梯度洗脱,流速1.0 mL·min-1,检测波长320 nm,对各产地文王一支笔进行HPLC分析。采用中药指纹图谱相似度评价系统建立指纹图谱共有模式和相似度计算,SPSS20.0和S
针对可穿戴设备的长时间心电记录、实时分类及对心电数据的远程监测分析问题,开发了一个对接医疗级心电采集终端,并实现实时监测、实时分析,并通过深度学习模型自动对心律失常分类的通用系统。该系统中部署的深度学习模型是基于残差网络构建的,深度学习模型的训练和测试使用2017年心脏病学挑战赛(CinC2017)提供的数据集。训练和测试结果显示,模型具有较好的性能。系统通过反向代理服务器(Nginx)部署在阿里
生物多样性演化模式及其与环境变化的相互关系是现代古生物学的研究热点之一。随着年代地层学和古生物学的发展,传统的多样性统计方法不能满足当今高精度地层对比分析的需求,而定量地层学方法具有更高的时间分辨率,在深时生物多样性研究中正得到广泛应用。本文简要介绍了目前常用的定量地层学方法(包括图形对比法、约束优化法、RASC法和单元组合法),以及应用约束优化法进行地层综合对比的过程,包括:选择数据、厘定和输入
化石燃料的过度使用给环境带来了不可逆转的影响,随着节能减排观念的提出,具有高热值的清洁能源天然气占比逐年增高。液态天然气(Liquefies Natural Gas,LNG)体积小、重量轻,常用于天然气的贸易运输。FSRU船舶(Floating Storage and Re-gasification Unit)除了可对LNG进行运输外,还能在近海岸对LNG进行卸载、气化等工作,具有较强的灵活机动性
随着经济、技术的发展,新的消费形式潜移默化的促使了人们超前消费观的形成,贷款逐渐成为了新消费形式下的主要承载对象。互联网金融应运而生,将个人信贷业务广泛的开展到人们的生活之中,信贷的发展不仅解决了个人资金短缺的问题,还加快了社会资金的周转,促进了整体的消费。可信贷的高风险性一直是人们十分在意的问题,如何帮助贷款机构建立全面、完善、准确的风险评估模型,提前防范违约风险、甄别关键风险特征,成为了一个重