论文部分内容阅读
支持向量机(SupportVectorMachine,SVM)是在统计学习理论的基础上发展起来的一种新的机器学习方法,它在小样本问题中表现出很多良好性能。但如果遇到问题规模较大时,如样本维数很高,训练样本数很大,许多经典模式识别方法都会出现学习速度慢,占用内存空间大等问题,如神经网络等方法还会出现陷入局部极小的问题。由于SVM识别过程要对样本在高维空间进行映射,数据规模大引起的问题更为严重,采取一些优化算法显得尤为重要。
本文主要采取两种方法解决这一问题:一是对数据样本本身进行处理,采取独立成分分析(IndependentComponentAnalysis,ICA)进行降维;二是对支持向量机算法本身进行改进,使其训练速度进一步提升。
ICA的主要目的是寻找一种适当的变换,使变换后得到的信号尽可能的相互独立,过这种变换可以找出数据之间隐含的结构关系。作为主成分分析和因子分析的的一个扩展,在某些情况下作为一个更加有效的工具,ICA可以找出主成分分析和因子分析所不能发掘出的隐含因素,从而使降维后的数据更加有代表性,对分类的支持更好。特别的,本文将对非线性版本的独立成分分析做出尝试,使特征提取更加符合样本自身情况。
支持向量机算法中,主要对序列最小优化(SequentialMinimalOptimization,SMO)方法进行改进,采取更准确的二阶信息对训练集进一步优化,以减少训练、收敛时间。
最后,将上述算法应用于机器嗅觉气味识别系统中。实验结果表明,本文方法有效解决了机器嗅觉的气味识别问题,并取得较好的学习速度和分类精度。