决策树算法实现及其在信用风险控制中的应用

被引量 : 0次 | 上传用户:cyberfu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本学位论文中,我们主要考虑决策树C4.5算法在信用风险控制方面的作用,并且为了减少预测误差,运用二项分布置信区间估计的方法改进了其悲观错误修剪算法。为此,我们先简要介绍了信用风险及其常有用的控制方法;然后阐述了决策树的内容,并指出其在控制信用风险中的应用;从理论上介绍决策树C4.5算法模型,包括其生成的信息熵、信息增益理论,修剪时所用的悲观错误修剪法及运用贝叶斯原理及二项分布区间估计原理改进后的悲观错误修剪算法等;最后用恒丰银行制造业及房地产业数据运用Matlab软件编程实现算法,建立模型,以实例验证决策树算法在信用风险控制上的应用及其显著作用。由实例应用可得,决策树模型对信用风险的识别能力较强从而能够较好的控制信用风险;所选取的作为判断分类条件的指标具有普遍性,具有较强的说服力。并且决策树C4.5模型具有以下优点:1.能够生成易于理解的决策规则,易被人理解;2.清晰呈现重要的决策属性指标,便于以后做出决策判断及积累数据;3.计算量较小,大大提高了计算速度;4.既能处理数据量较小的情况,又能处理数据量较大的情况;5.可以同时处理连续的和离散的数据。这些优点使得我们能在有限的数据量下,方便快速准确的预测客户的信用风险,有助于银行信用风险管理人员及监管机构及时准确的掌握客户的信用风险状况,从而及时作出规避或降低信用风险的举措。但是,决策树法稳健性较差,即虽然其对训练样本的分类效果很好,但将所建立的决策树用于对保留样本的分类时,其错误比率有较大幅度的上升。在实际中,新的贷款申请人所属的总体可能与建模总体有一定的差异,决策树法的这种不稳健性可能造成错误分类率高。因此,我们在运用决策树进行分类预测时,一定要注意被预测样本所属的总体是否与所用模型属于同一总体。为解决这一问题,我们可以分行业对数据进行建模,也可以通过聚类分析找出待预测样本所属的总体,然后进行预测。
其他文献
2006年2月15日,财政部颁布了新的企业会计准则,并宣布于2007年在上市公司中正式实施。对比当前正在施行的企业会计准则,新企业会计准则发生了较大的变化,其中职工薪酬的应用成为
一、本体教育与人格教育 本体教育要求教师有更多方面的修养,有更为崇高的精神境界,更高的文化层次。深圳实验学校在实验中,把培养和造就优秀的教师队伍,看作是他们最关键的
师范生端正积极的择业动机对于教育事业发展有着举足轻重的作用,为此我们采用问卷调查了200名左右师范生的择业动机状态。结果显示,大多数师范生缺乏职业热情,选择师范专业并
权利不仅仅涉及个体利益的实现,更具有丰厚的文化和道德内涵。理解权利需要突破个人本位主义从共同体视角进行政治哲学分析,权利观念是在共同体生活互动所孕育的事实认知和规
<正>1概念鉴定1.1生物学重要概念中学生物学教材中的重要概念是对生命的基本现象、基本规律和基本理论的阐述和解释,是中学生物学教材知识的核心组成部分,是引领教师&#39;教&
目的:探讨硬膜外阻滞联合普瑞巴林治疗带状疱疹后神经痛(PHN)的疗效。方法:选取2018年12月至2019年10月本院收治的PHN患者60例,随机分为研究组与对照组,每组30例。对照组给予
<正>戚继光(1528—1588),山东蓬莱人,明朝杰出的民族英雄、军事家。他继承和发展了我国古代军事思想的精髓,写下了《纪效新书》、《练兵实纪》等著作,集中反映了他博大精深的
我国社会发展的方向是建设社会主义和谐社会,和谐的劳动关系是建设社会主义和谐社会的必备要素。实行法治,是以人为本的社会主义和谐社会的本质要求。而法治的终极目标,就是
精神分裂症是临床上发病率高、治愈率低的精神性顽疾,其发病机制与脑内多巴胺(dopamine, DA)、5-羟色胺和谷氨酸等多种物质异常有关,其中,DA递质失衡在精神分裂症中的作用为
教师文化是大学文化的亚文化之一。文章在分析教师文化概念的基础上,从学术职业文化、制度文化、工作文化和学科文化四个维度对美国高校教师文化进行了详细解读,以期对我国的