论文部分内容阅读
自21世纪以来,与计算机领域相关的软硬件技术蓬勃发展,为人工智能技术的兴起打下了良好的基础,而量化交易由于其高效和稳定的性能吸引了更多的投资者。在本文中,我们探索了深度强化学习以及元学习方法在量化交易中的潜力,提出了一种基于LSTM深度神经网络的智能体,以学习股票数据中的时间关系;并且使用策略梯度训练方法,依据当前的市场状况和历史数据进行自动化交易。本文主要完成以下工作:1.针对传统量化交易方法其表征金融信号时的缺陷,提出了格拉布斯去噪声的优化方法对金融数据进行处理,将其与量化交易系统结合,更为准确地捕捉到金融市场的特性。实验结果显示,格拉布斯去噪的优化过程可以大幅度提高智能体对股票数据的表征能力,从而超越传统方法的盈利性能。2.由于传统的量化交易方法在处理高维数据时存在难度,难以挖掘股票数据的历史意义,本文提出了基于深度强化学习的量化交易方法,智能体采用LSTM深度神经网络构造,在学习和记忆股票数据中的时序关系的同时探索最优的交易策略。实验证明,基于LSTM网络的交易智能体训练的性能优于基于全连接神经网络的智能体,前者最高收益率达到280%。3.由于金融数据存在大量噪声和冗余数据,金融指标虽然能表征出金融数据的内在关系和趋势,但是金融指标数量众多并且大量金融指标在不同情况下存在冲突和钝化等问题,为了更合理地表征市场状态以实现最大化累积利润的目标,对股票指标特征进行筛选和组合。本文所提出的股票交易系统在中国股票市场上进行了回溯测验:在大多数情况下交易智能体都能超额获益,具有良好的性能。4.由于深度强化学习过度依赖于大量训练数据,导致交易智能体无法快速适应复杂多变的环境。为了提高智能体的快速学习和泛化能力,将与模型无关的元学习引入到深度强化学习中,通过前期知识经验来指导智能体在新任务上的学习。实验结果对比表明,交易智能体能够快速适应环境变化,既能平衡收益和风险,同时也可以探索到较好的交易策略。本文将深度强化学习和元学习方法应用于股票领域的量化交易,使得交易算法在面对错综复杂的金融市场时,能够合理的表征市场状态,实时挖掘到高维股票数据隐藏的模式,选择最优策略以获得最大累积利润。因此该方法具有实用价值。