论文部分内容阅读
分类问题是模式识别领域所研究的核心问题之一。目前,分类器的设计部分,可以使用的理论有很多,主要包括:基于统计理论的方法、线性判别函数、神经网络的方法、随机方法、机器学习、非度量方法等等。本文以机器学习中的集成学习理论为基础,将Boosting算法的代表形式AdaBoost算法应用于经典的二分类与多分类问题,其中AdaBoost算法的弱分类器选择分别为径向基函数网络、标准的支持向量机(Support Vector Machine,SVM),并与现有的径向基函数网络、标准的SVM进行了性能比较,以验证AdaBoost分类算法的有效性。在此基础上,进一步将AdaBoost分类算法作为集成学习框架中的学习器进行再次集成,给出了AdaBoost-AdaBoost算法,作为弱分类器的AdaBoost,其自身的弱分类器选择为径向基函数网络。将AdaBoost-AdaBoost算法应用于基准分类问题,以及医学领域中的实际分类问题,实验结果表明了算法的有效性和可行性。本文的主要研究内容具体包括如下几个方面:在基于Boosting算法的集成学习基础上,分析研究了AdaBoost算法,研究了径向基函数网络、标准的SVM作为弱分类器构成的AdaBoost算法;通过分析AdaBoost算法理论,给出以AdaBoost作为弱分类器的AdaBoost-AdaBoost算法。将所研究的不同AdaBoost算法及AdaBoost-AdaBoost算法应用于基准二分类及多分类实验中,与现有的径向基函数网络、标准的SVM进行了比较。实验结果表明,弱分类器为径向基函数网络的AdaBoost算法能够很好地解决分类问题,在性能上有一定改善;SVM的核函数为径向基核函数,弱分类器为标准SVM的AdaBoost算法,其分类性能得到了进一步提升;以AdaBoost作为弱分类器的AdaBoost-AdaBoost算法,其分类性能最好。以判断病人是否能够脱离辅助呼吸器的医学领域分类应用为背景,将AdaBoost-AdaBoost算法对其数据进行实验研究,结果表明,在处理实际分类应用问题时,AdaBoost-AdaBoost算法是有效的。