论文部分内容阅读
在国内市场经济体制持续改善的背景下,股票市场在我国经济体系中占有越来越重要的地位,参与股票投资的人也逐渐增加。股票价格的波动影响着社会经济生活的各个方面,因而有效预测股票走势在实际应用方面存在很大的价值。传统的时间序列预测模型一般只能找到数据之间的线性关系,而股票数据本质上是高噪声的、动态的和非线性的。与传统方法相比,深度学习理论凭借其强大的自学习能力和非线性逼近能力,能够很好地解决股票预测中数据众多、非线性关系复杂等问题。本文以深度学习理论为基础,探究了人工神经网络在股指预测上的可行性,主要研究工作如下:(1)股指收盘价受诸多因素影响,因此数据集必须能够包含尽可能全面的指标。除了选取最常见的“四价一量”(开盘价、收盘价、最高价、最低价和成交量)等基本指标,本文还在股指日线数据的基础上计算出了相关的技术指标,建立了股指预测的指标体系。(2)构建了一个融合卷积神经网络(Convolutional Neural Network,CNN)和门控循环单元(Gated Recurrent Unit,GRU)神经网络的混合股指预测模型。针对股指数据高维度、高噪音的特点,利用CNN优秀的特征提取能力充分发掘股指数据之间的内在联系,从而降低原始数据的规模和复杂度。股指数据是一种时间序列数据,通过GRU神经网络的时序记忆能力可以进一步学习股指数据内部的动态变化规律,确立输入和输出间的非线性关系。(3)在输入时间序列较长时,GRU神经网络容易丢失序列信息且难以对数据之间的结构信息进行建模。为了解决这一问题,本文在GRU神经网络中引入注意力(Attention)机制,提出了一个基于Attention机制的CNN-GRU混合股指预测模型。Attention机制对GRU神经网络的隐藏状态赋予不同的权重,以保证包含重要信息的特征不会随着步长的增加而消失,加强重要信息的影响,使GRU更容易学习股指数据的长期依赖关系。(4)以沪深300指数为例,分析了模型参数对股指预测结果的影响,分别讨论了卷积层层数、卷积层卷积核个数、GRU层层数、GRU层神经元数目和优化学习方法的确定过程。为了评判本文所构建模型的性能,比较了CNN-GRU模型、CNN-GRU-Attention模型、CNN模型、长短时记忆(Long-Short-Term Memory,LSTM)模型和GRU模型对沪深300指数进行预测的结果,并将CNN-GRU模型和CNN-GRU-Attention模型进一步应用于上证综指和深证成指的预测。实验结果证明,与CNN模型、LSTM模型和GRU模型相比,本文所设计的模型具有较强的预测能力和较高的预测精度,同时本文模型在上证综指和深证成指的预测中也取得了不错的结果。这充分体现了本文模型强大的特征提取能力和良好的非线性时间序列数据处理能力。本文为股指预测的研究提供了一种新的思路,同时,在辅助高频数据交易上存在一定的实际意义。