论文部分内容阅读
随着机器学习和人工智能的飞速发展,这些技术被越来越多地应用在金融领域中的股票市场上。在大部分股价预测研究中,股票指标被广泛地应用在各种预测模型中。作为一个统计学的范畴,股票指标根据一定的数学统计方法,使用统计学数值来论证股价和买卖的趋向,证券市场上已有相当数量的股票指标,本文在股票指标基础上提取新的行为特征用以预测股价趋势。目前有很多相关的研究使用股票指标数值通过机器学习方法来预测股价趋势,然而其中大部分研究只是把重点放在预测模型本身的改进上,并没有对作为输入特征的股票指标做进一步的分析,仅仅把这些股票指标的数值单纯地作为模型的输入特征,而没有考虑到指标当初被设计时的使用方式。为了提高股价预测模型的学习效率和预测效果,本文采用指标统计分析手段优化行为导向的股票指标特征,并使用分形降维算法,发现其中冗余的股票指标,削减噪声特征。部分行为导向的指标,即指标的数值大小并无意义,只有指标函数表现出穿插等特定的行为时才具有实际意义,如KDJ指标。针对这样的行为导向指标,本文采用对指标间行为量化的方法,达到优化指标的目的。本文实验验证优化后的行为导向指标具备更好的区分度和预测能力。在指标降维方面,对于传统的降维方法如奇异值分解(SVD),其降维结果会破坏原数据集,难以对降维后的数据进行分析。因此针对股票指标特征集合这种特殊的数据集,本文改进了一种基于分形维度的降维算法以适应较大规模的股票指标数据集的运算,并在此基础上实现了股票指标筛选。通过实验对比,新的分形降维算法表现出较好的性能,降维结果与SVD相近,并且在降维的基础上能够保留相对重要的股票指标。本文实验数据来自1991年至2015年的A股2000多只股票的日级交易数据集。本文使用优化后的行为特征指标以及基于分形维度的特征选择算法,在支持向量机预测模型上的预测效果要优于采用行为量化特征前和分形降维特征选择算法前的预测效果,分别有将近1%以及3%左右的提升。