论文部分内容阅读
2008年的金融危机给全球经济造成了巨大损失,在全球化趋势下,企业之间竞争越来越激烈,因而企业信用风险引发了广泛的关注,建立完善的防范风险机制迫在眉睫.企业拥有各种各样的金融数据,过去很多信用风险模型借助这些数据去判断企业的信用风险,然而在大数据背景下,越来越趋于高维的数据给建模带来了很多难题,传统意义的企业信用风险评价模型日渐失效;与此同时,人工智能迅速兴起,支持向量机等新技术在各个领域得到了广泛地应用,特征选择成为降维的有力武器,而集成学习则通过融合多个子分类器的方式减少了单个分类器的偏差和错误.基于这样的背景,本文在学术研究中提出了一种两阶段特征选择方法.首先对特征选择方法进行稳定性检验,稳定性检验确保所选的特征在整个数据集上都是具有代表性的;然后在过去的研究中,最优特征的数目往往是通过经验确定的,本文对每个特征进行量化评分,将封装式特征选择的思想引入到过滤式特征选择中,以实现去除冗余、降低维度、提高模型准确率的目的;最后基于两阶段特征选择的工作,提出混合模型HFMG,采取组合多个子学习器的模式来进一步提高分类能力,增强模型可靠性.本文结合上市公司信用风险评价来做实证分析,真实数据集包含160家上市公司,每个公司都有22个特征属性,实验结果表明两阶段特征选择法研究具有重要意义,混合模型HFMG取得了好的效果,它不仅能在信用风险评估中使用,也能应用于更多其它的领域.