论文部分内容阅读
统计学习理论,又被称为统计机器学习理论,是一种针对小样本数据的数据分析和挖掘理论。支持向量机是建立在统计学习理论基础之上的模式识别模型,针对模式识别的两大问题——分类和回归问题,支持向量机在解决小样本、非线性问题上具有优异且稳定的性能。本文主要针对支持向量机的回归问题,结合2002年Lin等人提出的模糊支持向量机的概念和方法,开展了如下几点工作: (1)详述了基于SMO的求解ε-SVR算法及其推导过程,对含有201条记录的上证A股综合指数收盘价格与时间的函数关系进行了拟合,同时利用其它常用的回归方法对该函数关系进行拟合,并将拟合结果进行对比和分析。 (2)提出一种基于马氏距离的模糊隶属度函数。基于马氏距离的构造特点,该隶属度函数将相关性信息引入ε-FSVR,并且能够利用核函数将问题推广到非线性的情况,具有较强的泛化能力,通过数值试验,验证了该方法对回归模型的准确率有所提高。 (3)分别利用交易指标(如开盘价、收盘价、成交量、MACD等)和时间序列递推思路,构建了两种特征提取方法,并基于马氏距离的模糊支持向量回归机,对上证A股综合指数的价格进行预测,并对该方法的性能和在金融领域的推广能力进行了分析。