论文部分内容阅读
随着机器学习技术的迅猛发展,基于机器学习的预测方法越来越多地应用到股指预测中,然而目前股指预测的一些算法不能够很好地适应证券数据的波动特征,预测准确率仍有提升的空间。因此找到证券数据的波动特征,进而构建一个能够提高预测准确率的预测模型,探究证券数据的内在规律,使得股票市场能够更好地发挥作用,并且在满足市场监管和投资者需求等方面有重要的现实意义和理论价值。本文的主要研究内容如下:
(1)本文将模型树算法应用于证券数据分析,并提出了一种新的分裂算法——最大离差法,解决了模型树中常用的最小损失函数分裂算法在寻找分裂点时存在的问题。使用基于最大离差算法的模型树(Model Tree Based on Deviation Maximization,MTDM)获得股指数据的最佳分裂点,经过多次分裂,将股指数据分裂为多个数据段,使其能够符合证券数据的走势特征。使用沪深300指数日收盘价数据进行实验,验证了本文提出的算法相较于基于最小损失函数的模型树算法(Model Tree Based on Least Loss Function, MTLLF)获得的分裂点更加合理,最后使用基于最近分裂段的线性回归算法对其进行预测,通过多项预测衡量指标验证了该模型的预测效果较好。
(2)针对原模型树算法只使用最近分裂段进行线性预测,将其余各分裂段的信息丢弃的问题,结合证券领域的波浪理论,本文提出了基于波浪理论的模型树(Model Tree Based on Wave Theory,MTWT)构建和调整算法。根据最大离差分裂算法获得的分裂点,构建和计算出分裂段的时间、空间等属性信息,并通过本文提出的构建算法,构建出初始的基于波浪理论的模型树,随后使用调整算法调整各分裂段的级别和父子关系,使其能够保留各分裂段之间的关联信息。使用沪深300指数日收盘价数据进行实验,验证了构建和调整算法的正确性。
(3)在前述股指分裂、模型树构建和调整的数据基础上,本文提出了基于波浪模型树的股指预测模型,使用多段股指数据信息进行预测。使用沪深300指数的日收盘价数据进行实验,使用多项预测评价指标衡量模型的预测误差,并通过多组对比实验验证模型预测效果。实验结果表明本文提出的股指预测模型相较于长短记忆神经网络(Long Short-Term Memory,LSTM)、门控循环单元(Gated Recurrent Unit,GRU)以及多层感知机(Multilayer Perceptron,MLP)预测模型有更好的预测效果,验证了本文预测模型的有效性。
(1)本文将模型树算法应用于证券数据分析,并提出了一种新的分裂算法——最大离差法,解决了模型树中常用的最小损失函数分裂算法在寻找分裂点时存在的问题。使用基于最大离差算法的模型树(Model Tree Based on Deviation Maximization,MTDM)获得股指数据的最佳分裂点,经过多次分裂,将股指数据分裂为多个数据段,使其能够符合证券数据的走势特征。使用沪深300指数日收盘价数据进行实验,验证了本文提出的算法相较于基于最小损失函数的模型树算法(Model Tree Based on Least Loss Function, MTLLF)获得的分裂点更加合理,最后使用基于最近分裂段的线性回归算法对其进行预测,通过多项预测衡量指标验证了该模型的预测效果较好。
(2)针对原模型树算法只使用最近分裂段进行线性预测,将其余各分裂段的信息丢弃的问题,结合证券领域的波浪理论,本文提出了基于波浪理论的模型树(Model Tree Based on Wave Theory,MTWT)构建和调整算法。根据最大离差分裂算法获得的分裂点,构建和计算出分裂段的时间、空间等属性信息,并通过本文提出的构建算法,构建出初始的基于波浪理论的模型树,随后使用调整算法调整各分裂段的级别和父子关系,使其能够保留各分裂段之间的关联信息。使用沪深300指数日收盘价数据进行实验,验证了构建和调整算法的正确性。
(3)在前述股指分裂、模型树构建和调整的数据基础上,本文提出了基于波浪模型树的股指预测模型,使用多段股指数据信息进行预测。使用沪深300指数的日收盘价数据进行实验,使用多项预测评价指标衡量模型的预测误差,并通过多组对比实验验证模型预测效果。实验结果表明本文提出的股指预测模型相较于长短记忆神经网络(Long Short-Term Memory,LSTM)、门控循环单元(Gated Recurrent Unit,GRU)以及多层感知机(Multilayer Perceptron,MLP)预测模型有更好的预测效果,验证了本文预测模型的有效性。