基于分层深度强化学习的量化策略研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wjlcqjy68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统量化交易策略在股票、期货等金融市场有广泛的应用,但特征的手工提取方法使其缺乏有效动态调整策略的能力,深度强化学习能有效地模拟复杂市场环境和解决动态量化交易问题。本文基于深度强化学习对量化交易策略进行研究,主要工作如下:分解量化操作中趋势判断与量化择时决策的异步性以及数据相关度依赖性强弱的差异,对比现有深度强化学习模型所存在的不足、创新使用分层深度强化学习结构应用于量化交易。创建基于半马尔可夫性分层深度学习智能交易体H-Trader:H-Trader上层控制器Meta-controller在长跨期窗口下对行情趋势判断,趋势信号提示持仓变化时激活下层控制器Controller;Controller基于时序数据计算高依赖度在短期视窗下量化择时任务,达成头寸更新目标后控制权转移回上层Meta-controller。考虑实际策略中的收益再投资,以复合收益下的奖赏函数Reward替代常用简化受限的加和利润表达式,计算过程引入双重指数贴现因子;使用模糊表示技术进行长期趋势特征的学习,结合FCM算法软聚类分配权重给模糊特征表示;使用指数化扩张堆叠的多层Dilated LSTM结构实现Meta-controller对于记忆粗颗粒度状态的处理;对Controller在量化择时中所需要的数据强相关度计算,通过加入Self Attention层与FC混合结构抽取时序数据间依赖关系。对分层深度强化学习H-Trader模型进行量化交易实验,实验结果表明强化学习三个交易策略H-Trader、Vanilla DQN、DDPG在四个测试数据集上具备一定的性能表现,H-Trader无论是总收益还是风险控制能力,都有较好的性能数据。
其他文献
学位
学位
随着电力电子技术的发展,以碳化硅(SiC)为代表的第三代半导体材料技术和工艺趋于成熟。与传统的硅(Si)材料功率器件绝缘栅双极型晶体管(IGBT)、金属氧化物半导体场效应晶体管(MOSFET)等相比,SiC功率器件具有高耐压、低损耗、高热导率、高开关频率的优势。目前电动汽车的电机控制器中主要使用Si模块作为逆变电路的功率器件,由于Si材料本身特性的限制,电机控制器的效率提升遇到瓶颈,因此在电动汽车
学位
钢结构在结构体系上的优点和特征,非常切合我国推广绿色节能建筑和工业化生产建筑的转型要求。受国家层面利好政策影响,钢结构行业迎来快速发展期,行业产值逐年增长,具备资质等级的钢结构专业承包企业数量迅速增加。在这种背景下,业主单位选择具有综合实力和施工质量保证能力的钢结构企业将有效规避施工质量风险,提升产品竞争力。本文从业主单位视角出发对钢结构企业的施工质量保证能力进行评价研究。首先在研究现有工程质量管
无线电能传输技术(wireless power transfer,WPT)使电动汽车充电实现了自动化,与自动驾驶技术完美结合,是促进电动汽车普及,实现“碳中和”目标的重要基础技术。本文围绕宽耦合范围的电动汽车无线充电系统设计和控制方法开展研究,取得以下主要成果。本文针对串联-串联(series-series,SS)补偿WPT系统在强耦合区域的频率分裂特性所带来的功率输出问题,对比研究了定频对称调谐
随着碳达峰、碳中和目标的推进,天然气将成为国家主要的过渡能源。当前,我国天然气消费量和管道里程数不断增长。然而,较多管网营运时间长,管道安全管理水平不足。近年来,天然气管网发生多起失效事故,造成了经济损失以及生态环境破坏。因此,天然气管网风险态势的相关研究受到了工业界和学术界的高度重视。反映天然气管网安全态势的数据主要包括静态数据和动态数据。静态数据包括管径、埋深、管材等管网自身属性,这些静态数据
学位
学位
无刷直流电机具有结构简单、体积小、功率密度大、控制方式简单等优点,在日常生活和工业应用中皆具有广泛的应用。在中小型电动汽车领域中,为了同时兼顾电机系统的控制性能以及成本,通常选用无刷直流电机作为主驱电机。电动汽车中的无刷直流电机定子电阻以及直轴电感、交轴电感是优化电机dq轴电流内环控制的重要参数,若要实现对电机的高性能矢量控制,那么对电机定子电阻以及直轴电感、交轴电感的辨识技术的研究显得十分必要。