基于机器学习模型的制造业企业信用评级研究

来源 :债券 | 被引量 : 0次 | 上传用户:sunyanjun03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文基于可得数据,采用特征工程方法提取影响信用资质的核心因素,并将其作为自变量构建制造业企业信用违约預测的Logistic回归模型和信用评分卡。实证结果显示,企业性质、销售费用/营业收入、流动资产周转率、带息债务/全部投入资本等六个指标对违约概率影响显著。通过建立机器学习模型评级和外部评级之间的映射表,有望实现风险企业排雷、信用价值挖掘、信用风险定价等功能。
  关键词:机器学习特征工程 制造业企业信用评级
  得益于大数据和非结构化数据处理技术的发展,基于大数据的机器学习模型应用日益广泛。机器学习算法是根据特征对事物进行分类,本质上是降熵过程。企业信用评级是利用不同的信用评分或评级对样本进行分类,进而实现将企业违约概率从等概率分布转换为非等概率分布。非等概率的熵低于等概率的熵,信用评级降熵可用于评价企业信用资质。从功能和目标的角度看,将机器学习模型应用于企业信用评级具有一定优势,但需要以大数据为基础,以保证学习效果和参数估计准确,避免过拟合。考虑到难以具备海量企业样本数据,在建模时,使用有较少参数估计需求的Logistic回归算法更为合适。为减少变量共线性对模型估计的影响,笔者采用特征工程方法提取信用资质驱动核心因子入模。从行业看,制造业企业违约样本数居行业之首,负样本数量相对充足。将特征工程和机器学习方法应用于制造业企业信用评级在技术和数据方面具有较好的可行性。
  指标选取、数据来源及特征工程
  在样本选择方面,笔者选择证监会行业分类标准下的制造业,训练正样本为截至2021年一季度末有存量债券、未发生违约事件且评级在A级以上的企业主体,共682家;负样本为2014—2019年发生违约事件或者评级在BBB级及以下的企业主体,共56家。正负样本之比约为12:1。将外部评级为BBB级及以下的企业视为负样本基于两方面考量:一是BBB级以下属投机级,违约风险较高,考虑到外部评级实行发行人付费模式,为审慎起见,将正负切分线上调至BBB级;二是多数金融机构限制准入外部评级在A级及以下的债券,认为BBB级及以下债券的违约风险较高。
  在观察期和表现期选择方面,考虑到债券市场的价格敏感度高于评级公司跟踪评级以及真实违约消息,笔者将债券估值偏离度大于10%、评级低于A级、首次违约等三个事件发生之前作为样本企业观察期,将观察期数据作为Logistic回归自变量数据。观察期之后为表现期,将表现期违约与否作为因变量数据。
  为客观地基于机器学习模型预测制造业企业违约情况,需构建信用资质影响因子矩阵。考虑到信用债发行主体样本总量相对有限,且待估参数过多可能影响估计结果,笔者将企业性质和30项财务指标作为原始指标,具体包括:一是盈利能力指标6项[销售净利率、销售费用/营业总收入、营业利润/营业总收入、税息折旧及摊销前利润(EBITDA)/营业总收入、经营活动净现金流/利润总额、净资产回报率的增长率];二是现金流量指标4项(经营活动产生的现金流量净额/营业总收入、经营活动产生的现金流量净额占比、投资活动产生的现金流量净额占比、投资活动现金净流量/营业总收入);三是营运能力指标4项(存货周转天数、应收账款周转率、流动资产周转率、总资产周转率);四是偿债能力指标5项(长期负债占比、EBITDA/利息费用、经营活动净现金流/带息债务、经营活动净现金流/总负债、货币资金/短期债务);五是成长能力指标7项(营业总收入同比增长率、利润总额同比增长率、净利润同比增长率、营业利润同比增长率、净资产同比增长率、营业总收入3年复合增长率、净利润2年复合增长率);六是资本结构指标4项(资产负债率、长期资本负债率、带息债务/全部投资资本、流动负债/负债总计)。
  利用特征工程方法从原始指标筛选入模变量。在进行特征工程之前利用相关性分析和VIF检验剔除了方差膨胀因子VIF大于10的指标。特征工程首先对原始指标进行分箱,透过卡方分箱方法计算不同指标的证据权重WOE和信息量IV值,如表1所示,最终选取IV值大于0.2的变量入模,确保入模变量具有较好的违约预测能力。
  机器学习模型:Logistic回归及结果
  Logistic回归模型将多元线性回归通过Sigmoid函数转为违约概率预测的计算函数,因变量是样本违约与否的结果,自变量为特征工程筛选出的22个特征变量。通过回归结果的p值测量回归系数的显著性大小,结合逐步回归确定最终入模指标。笔者选择显著性较高(p值小于5%)的特征变量。对样本按照7:3的比例随机分为训练集和测试集,训练集回归结果如表2所示。
  从回归结果来看,制造业企业信用影响因子涵盖企业性质、盈利能力、营运能力、资本结构、偿债能力和成长能力中的6个指标。如图1所示,结合特征工程分箱及不同箱体的WOE值分析内在机理。预期内的结论是:影响信用资质的核心指标包括企业性质、流动资产周转率、经营活动净现金流占负债的比例、有息负债占投入资本的比重、净利润复合增长率。超预期的结论是:销售费用占营业收入的比重越低越容易违约。这说明对于制造业企业来说,销售收入可提高盈利和偿债能力。
  如表3所示,训练集和测试集的KS值分别为0.67和0.65,显著大于0.3,说明模型具有良好的等级区分能力;由表4可见,训练集和测试集的AUC值分别为0.90和0.88,显著高于0.75的界限值,说明模型具有较高的精准性;表4所示测试集的混淆矩阵显示模型应用于测试集的效果较好,违约预测精准度高达73.33%。
  制造业企业信用评级模型及评分卡
  基于Logistic回归模型及参数估计结果,计算制造业企业的违约概率p,再基于p构建信用评级评分卡,评分Score=500-20?log(p/1-p),即以500分为基准分,以20分为单一等级分数区间,违约概率越高,则评分越低。基于上述逻辑构建制造业企业的信用评分卡,如表5所示。基于评分卡对存量738家制造业企业进行信用评级打分,以30分划分一级,将企业分成12个等级,结果如表6所示。10级以上企业占比为13.69%,与外部评级相比,模型更具区分度。外部评级为AA级及以上的企业占比为70%,AAA级占比高达22%,集中度较高,区分度较低。
  在信用违约预测方面,机器学习模型表现较好,违约预测命中率达75%。如表7所示,2020年下半年至2021年一季度实际违约企业4家,其中3家基于2019年数据的评级结果低于6级,基于2018年数据的评级结果均低于7级,仅B公司的评级结果为9级。
  研究结果的潜在应用
  将制造业企业外部评级和基于机器学习方法的信用评级建立二维映射表,如表8所示,单元格内容代表外部评级为该列对应外部等级和机器学习模型评级为所在行对应模型等级的企业家数。映射表可用于三个方面。一是风险企业排雷,当企业外部评级低于AA-级且模型评级低于5级时,可认为信用风险较高,应避免投资。二是信用价值挖掘,当企业外部评级在AA-级及以下,但模型评级为9级及以上时,可进一步研究,挖掘被市场误判带来的信用溢价。三是警惕市场高估,当企业外部评级在AA-级以上,但模型评级为5~9级时,可考虑结合进阶信用研究并利用债券借贷等做空机制参与做空。
  学习模型结果还可用于信用风险定价和内部评级检验。利用模型评级结果计算不同等级的违约概率,并将违约概率应用于不同信用等级制造业企业的信用风险定价。模型评级还可为机构内部评级提供交叉验证和补充,助力内部评级方法的改进和完善。
  注:1.单元格内数字代表同时具有相应外部评级和模型评级的企业数量
  2.橙色区域为可选优质企业区,绿色区域为信用价值挖掘区,深蓝色区域为市场高估区,红色区域为排雷区
   作者单位:东莞银行资产负债管理部
   责任编辑:陈森  鹿宁宁
其他文献
摘 要:近年来,商铺在投资领域受到热捧。商铺购买者的购买目的一般为满足投资、经营或居住需求。《消费者权益保护法》(以下简称《消法》)对消费和消费者的概念有着清晰的阐述,“为生活消费需要购买、使用商品或者接受服务”的行为界定为消费者的消费行为。而商铺购买者是否可以作为消费者受《消法》保护各方观点不尽相同,从司法判例中可看出,大部分人倾向于将商铺购买者看作非消费者,而是一般的房屋买受人,商铺购买者是否
价格风险监测  2021年8月,中债-新综合净价指数下降0.01%,至101.19点,波动率处于历史值的50%分位数;10年期国债收益率上行1BP,至2.85%,波动率处于历史值的44%分位数。  信用风险监测  8月,债券违约规模环比下降。当月新增违约或展期债券9只,规模合计为82.20亿元,月度违约率为0.31%;新增违约或展期企业2家,除了已违约或展期的债券,还存续1只20亿元待偿债券。  
摘要:美联储7月议息会议记录令市场预判美联储将缩减购债规模。2021年2月以来,新兴经济体金融风险逐步显现,复苏进程出现分化,部分内部脆弱性凸显的新兴经济体可能面临严峻处境。回顾2013年5月,时任美联储主席伯南克表达的缩减资产购买意图曾引发“缩减恐慌”。因此,应关注新兴经济体“缩减恐慌”是否会重演。对此,本文进行了相关分析和判断,并提出个别新兴经济体国家面临较严峻的风险。  关键词:美联储政策转
摘 要:“一带一路”倡议给大连市提升对外开放水平带来重要的历史机遇,也带来了诸多挑战。本文探讨了“一带一路”背景下大连市绿色海洋经济的发展机遇以及挑战,提出了大连市绿色海洋经济的发展转型路径:构建“生态+”绿色海洋经济发展模式、加强海洋生态技术创新、推进海洋环境资源市场化、优化绿色金融创新与供给、加强海陆统筹建设。本文旨在有效拓展大连市海洋经济发展新空间,促进大连市绿色海洋经济的可持续、绿色化、低
摘 要:2018年4月13日,习近平总书记宣布,党中央决定支持海南全岛建设自由贸易试验区,旨在推进中国特色资源贸易建设工作。从2013年上海自贸试验区出现至今,党中央一直关注国内国际的发展形势,并作出了一系列重大决策。习近平总书记在十九大报告中明确提出要赋予自由贸易试验区更大的改革自主权利,探索建设自由贸易港。这说明海南地区的金融和经济体制将要经历一个全新的时代,在此背景下,需要正确理解金融和外贸
摘 要:“一带一路”倡议是推动区域经济协调发展的重要战略,跨境电商作为带动区域协调发展的方式之一,能展現促进经济发展的有效动能。本文结合“一带一路”倡议的布局,以跨境电商和区域发展现状为基础,分析跨境电商为区域协调发展创造的新机遇,厘清跨境电商对区域协调发展的作用因素。以江苏为例,在深入分析区域经济失调现状,以及“一带一路”倡议下跨境电商对区域发展的作用梳理,从政策和协同层面构建了“一带一路”倡议
摘 要:本文在回顾述评突发重大公共卫生事件的内涵、政府应急管理能力和共享机制相关研究的基础上,分析了在新冠疫情严格防控背景下商贸流通应急机制存在的明显问题,提出商贸流通应急共享机制的主要思路与架构,并从需求信息的归集和共享零售、共享采购、共享物流、共享员工等方面提出突发重大公共卫生事件背景下商贸流通应急共享机制的运行对策。  关键词:突发重大公共卫生事件;商贸流通;应急;共享机制  本文索引:楼永
随着互联网的发展以及人们生活方式的改变,网络在日常活动中的参与感越来越重,线上旅游正是互联网与传统旅游的结合,不仅便利了消费者的出行游玩,而且还为客户提供了更多选择和优质体验。本文建立评价指标体系,利用灰色系统理论,根据搜集的数据对中国线上旅游消费的市场潜力及影响因子进行分析,并且对其未来短期的市场潜力进行预测。