论文部分内容阅读
股票市场是一个动态的、非线性的高噪声系统,由于受到政治因素、经济状况以及投资者预期等诸多复杂因素的影响,股票价格的变化往往具有非线性、不可持续的特点。与此同时,随着科学技术的进步和信息传播系统的升级,事件被反应到股票价格上所需的时间越来越短,这导致了股价对相关事件的反应更加灵敏,波动频率更高。但是由于具有获得高额回报的可能性,股票市场一直是金融学、工程学以及数学等学科领域关注的市场。随着科学技术的发展、人们拥有的股票市场理论以及投资技巧水平的成熟,越来越多股票分析和股价预测系统被开发应用于股票投资实践当中。就目前而言,金融市场上主要的股票价格预测技术主要分为基本分析法、技术分析法以及数量分析法三种。数学模型和金融理论的进一步发展使得数量分析法在股票预测中所起的作用越来越大。传统的数量分析模型适合处理线性的、低噪声的时间序列数据,而大部分的金融时间序列数据具有非线性、高噪声等特点。神经网络模型由于具有出色的处理非线性、高噪声数据的能力逐渐被学者和投资者所重视。以往研究者的研究结论表明不同的神经网络模型在选择合适的参数时均能获得不错的结果,但是神经网络模型的结构也非常的重要,因为它直接影响了整个神经网络模型的表现。本文基于前人的研究基础上,利用长短期记忆模型能够学习和保存较远步骤信息的优点,构造出一个改进递归神经网络(ANN-LSTM)模型。本文主要分为六章:第一章简要介绍本文的研究背景、研究意义以及国外内关于神经网络模型用于股票预测的研究进展;第二章介绍股票预测理论知识、分析神经网络的结构以及算法;第三章对本文所使用的数据进行简要的描述和预处理以消除缺失值和异常值的影响,并且利用降维技术构造相关性最强、影响程度最高的特征变量;第四章对本文设计的ANN-LSTM模型进行学习和训练,并且以ANN模型作为对比,将训练好的模型用于嘉实沪深300股票指数基金收盘价涨跌方向的预测,以测试集准确率和损失函数作为主要衡量标准;第五章基于两种模型的预测结果制定量化投资策略,并且设定两种基准策略来衡量模型的实际应用能力;第六章对本文的研究结论进行总结,并且提出本文研究的不足之处以及后续的改进思路。通过实证分析发现,本文设计的ANN-LSTM模型在用于嘉实沪深300股票指数基金价格的预测时获得比ANN模型更高的预测精度,同时在量化投资策略研究中,我们设计的ANN-LSTM模型同样展现出较好的实际应用能力,表现为获得了更高的累计收益率和风险调整收益率。此外,我们将样本数据以2015年股灾发生时作为时间节点划分为两个阶段,结果显示ANN-LSTM模型在股票市场处于震荡修复期或平稳期时比在股票市场处于高涨时期时能获得更好的表现。