论文部分内容阅读
股票市场这类金融市场自诞生以来,各类数据模型以及机器学习、数据挖掘等方法都被投资者用于预测股价的未来走势,并获得丰厚的回报。股票市场作为一个公认的复杂动力系统,影响因素众多,具有非平稳性、非线性、高噪声、长记忆性等性质,很难简单通过数学模型对其进行解释,因此股票市场的分析与预测一直以来都是一个极具挑战的工作。随着深度学习方法在各行各业中取得了突破性的进展,金融研究者们开始将其应用于金融时间序列的预测研究。本文以深度学习方法为基础,研究了金融时间序列预测相关的问题,并以沪深300指数为预测对象,将2009-2019年沪深300指数相关数据作为研究样本,对下一日收盘价进行预测,设计了一个以长短期记忆深度学习网络(LSTM)模块为基础的金融时间序列预测模型。该模型结合了小波去噪模块、堆叠自编码器模块(SAE)和长短期记忆网络模块(LSTM)3个模块,进而对金融市场股价指数时间序列进行分析预测。本文选取了开盘价、收盘价等基本行情数据(OHLC)、MACD、ROC等技术指标以及SHIBOR等宏观经济指标,共21个指标作为模型的输入数据。首先,在小波降噪模块,本文选取了Sym6小波和SureShrink阈值方法,对股指的OHLC数据进行降噪处理,在此之后,将降噪后的OHLC数据与其他选取指标进行归一化处理作为下一个模块的输入数据。其次,在堆叠自编码器模块,本文选取了4层的网络结构,采用了L2正则化方法,将输入的21维数据降维至10维的输出数据,作为LSTM模块的输入数据。再次,在LSTM模块中,本文选取了性能更好的双向LSTM网络结构,利用自动调参算法确定了模型最优参数后,对输入的数据进行分析预测,进而得到模型的预测结构。最后,构建一个交易策略来检验该模型的盈利能力的表现,并与SAE+LSTM、小波去噪+LSTM、以及单一的LSTM模型进行对比。实证研究结果发现:(1)该模型克服了金融时间序列的非线性、非平稳性等特性并能达到很好的预测效果;(2)本文提出的模型在采用买入卖出策略时,盈利能力优异,说明本模型具有一定的实际应用价值;(3)本文提出的模型对沪深300指数这一类的较不成熟的、发展中的股票市场预测效果很好,具有一定的推广价值。