论文部分内容阅读
现如今全球经济产业格局正在进行不断地调整,制造业与数字化科学技术的融合升级带动了产业的变革。在《中国制造2025》发布的大背景以及中美贸易战的不断升级的大环境下,我国制造业上市公司如何保持良好、稳定的财务状况,避免在中美贸易战以及制造业市场逐渐激烈的竞争中出现财务困境,对于制造业上市公司至关重要。本文的研究对象主要为我国A股制造业上市公司,并将冠以“ST”或“*ST”的企业界定为面临财务困境的公司,同时利用2014年(T-3期)的财务和非财务数据对其在2017年(T期)是否面临财务困境进行模型的拟合和预测,并探究在集成学习中哪个模型能更准确地预测出存在财务困境的制造业企业,在帮助公司及早采取相应措施的同时,对国家证券监管部门监控上市公司质量和减少市场风险有积极意义。本文的主要工作概括如下:第一,对A股制造业上市公司T-3期(2014年)的财务和非财务数据进行预处理。对数据进行数据清洗、异常值处理、标准化以及运用过采样的SMOTE不平衡数据处理方式,生成了1443家非ST公司和361家ST公司。第二,通过结合单变量指标筛选方法(Pearson相关检验)和多变量指标筛选方法(随机森林),对特征变量进行筛选,选定了33个财务指标和3个非财务指标作为集成模型的指标体系,最终提取出11个主成分进行模型拟合。第三,随后运用集成学习中的随机森林、梯度提升树以及stacking算法构建了财务困境预测模型。其中将stacking模型结合了随机森林、梯度提升树以及决策树算法设计了两层学习器,其模型泛化能力在一定程度上比随机森林模型和梯度提升树模型的更强。第四,对所构建的三个集成学习模型进行评估和对比分析。结果显示,与同为集成学习的随机森林和梯度提升树模型相比,stacking模型具有更优的预测效果。预测出T期陷入财务困境的公司有99.99%的比例是实际陷入财务困境,且AUC值高达100.00%。说明stacking集成模型能较好分辨出该制造业企业是否陷入财务困境。综上,本文所构建三种集成模型中,stacking模型的财务困境预测效果最为理想,能为及时发现A股上市公司存在财务问题提供一定技术参考。