论文部分内容阅读
支持向量机(SVM)是机器学习领域中正在快速发展的一种技术,在模式识别、回归预测、密度估计等方面都有广泛的应用。支持向量机建立在统计学习理论的基础之上,特别适用于有限样本、非线性问题,得到的学习模型推广性较好,具有优良的性能。在应用SVM方法时,核函数的选用和参数的选择都会对SVM的性能产生很大的影响。最常用的寻找参数方法是网格搜索法,它是一种穷举式的搜索,没有利用启发式的信息。网格搜索法虽可以求出很好的参数,但需要消耗很长的时间。本文主要针对RBF核函数和SVM分类问题,利用了训练样本在特征空间中的分离性特征和RBF核SVM的渐近性质等一些研究成果作为启发式信息来快速确定一个近似最优的参数组合,并通过小范围的搜索来求精,得出了一种快速选择参数的方法,本文在LIBSVM工具包的基础上实现了该方法。
本文通过在几个UCI分类数据集上进行实验,将本文方法与网格搜索方法在运行速度和结果精度等方面进行了对比。实验数据证明本文方法在运行速度上比网格搜索方法有较大的优势,且结果的质量基本保持一致,这显示了本文方法有一定的实用价值。
在本文方法的适用范围和课题的理论深度等方面,都值得进一步探讨和研究。