论文部分内容阅读
支持向量机(SVM)是数据挖掘领域的一种新方法、新技术.它适用小样本、非线性和高维的模式识别领域,主要解决分类问题与回归问题.由于其良好的泛化能力,支持向量机在这些方面取得了较好的结果.支持向量机是基于最大间隔思想在原空间中建立最优超平面来进行数据的分类或回归.有时,需要通过引入核函数,把原始数据映射到高维的特征空间;然后在特征空间中建立最优超平面来解决分类问题与回归问题.本文的主要工作如下:第一章绪论中介绍了支持向量机的研究背景与意义、支持向量机的研究现状、本研究课题的来源及主要研究内容;第二章重点介绍了支持向量机的相关理论基础,主要包括统计学习理论、支持向量分类机的核心思想、经典的支持向量分类机及其变式;第三章利用马氏距离代替欧氏距离,推出了四类基于马氏距离的核函数,并对六类经典的支持向量分类机进行了合理的改造;第四章首先通过Fisher判别的思想,推出了四类基于Fisher判别的“F”核函数;然后构造了基于一类Fisher判别的各种支持向量分类机;第五章将模糊数学中最大隶属度与属性测度准则进行有机结合,提出了改进的属性测度准则模型;紧接着利用该模型构造了基于一类属性测度的六类支持向量分类机;第六章收集我国部分河流水质数据,并利用上述24种支持向量分类机进行实证分析;然后比较各类改进的支持向量机与经典的支持向量机之间的优劣.结果发现,基于马氏距离的支持向量机、基于一类Fisher判别的支持向量机相、基于一类属性测度的支持向量机均取得了不错分类效果,有的分类效果明显的好于经典的支持向量机.