论文部分内容阅读
企业信用评估是银行贷款业务经营的核心问题,评估结果对银行制定决策和获取利益具有重大意义。信用评估的可靠性、安全性和健全程度直接关系到贷款业务的成败。国内银行的信用评估方法目前还停留在传统的比例分析阶段,因此亟需建立一套更为科学的评估模型。目前该领域已经取得了一定的研究成果,但是由于我国的资信评估行业起步较晚,历史积累的样本少,应用传统的统计分析手段难以取得理想的效果,而神经网络等常用的机器学习算法在小样本情形下的泛化能力无法得到保证。针对这一问题的现状,本文引入了一种基于小样本学习理论的标准算法——支持向量机(SuportVector Machine,SVM),该方法特别适合于此类样本较少的学习问题。本文的研究主要包括两方面内容:一,本文提出一种改进的直推式支持向量机(Transductive SVM,TSVM)。TSVM是标准SVM在半监督学习问题上的扩展,但是传统的TSVM算法存在训练速度慢、回溯式学习多和性能不稳定的缺点。为此本文在直推式学习中融入后验概率(PostProbability)的思想,得到了基于后验概率的直推式支持向量机(PPTSVM),可有效解决上述问题。在企业资信样本上的对比实验表明PPTSVM在分类准确率和计算效率上优于TSVM。二,企业信用评估是一个多分类问题,而支持向量机在本质上是针对二分类问题设计的。因此本文对支持向量机多分类的扩展进行了研究,提出了两种解决方案:一是通过改变问题的表述方式,将多分类问题表述为二分类问题,提出了一种基于模型转换的SVM多分类方法;二是提出了一种基于聚类的二叉树结构生成算法,以类间可分性为度量,通过聚类的方式生成二叉树的节点,从而在每个决策节点将可分性最强的两个大类分开。实验结果表明,以上两种算法对多分类问题的处理可靠有效。