深度强化学习研究综述

来源 :计算机工程 | 被引量 : 0次 | 上传用户：zcykf

【摘要】

：

深度强化学习是指利用深度神经网络的特征表示能力对强化学习的状态、动作、价值等函数进行拟合,以提升强化学习模型性能,广泛应用于电子游戏、机械控制、推荐系统、金融投资等领域.回顾深度强化学习方法的主要发展历程,根据当前研究目标对深度强化学习方法进行分类,分析与讨论高维状态动作空间任务上的算法收敛、复杂应用场景下的算法样本效率提高、奖励函数稀疏或无明确定义情况下的算法探索以及多任务场景下的算法泛化性能增强问题,总结与归纳4类深度强化学习方法的研究现状,同时针对深度强化学习技术的未来发展方向进行展望.

【作者】

：

杨思明单征丁煜李刚伟

【机构】

：

数学工程与先进计算国家重点实验室,郑州 450001;中国人民解放军94162部队,西安 710600;中国人民解放军78100部队,成都 610031

【出处】

：

计算机工程

【发表日期】

：

2021年12期

【关键词】

：

深度学习强化学习深度强化学习逆向强化学习基于模型的元学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

开口镓熔点装置的复现及气压修正

中国计量科学研究院自行研制的开口镓熔点装置实现了对镓熔点冻制及复现的自动化,建立了开口镓熔点配置标准铂电阻温度计组成的基准装置.实验结果显示:镓熔点熔化温坪长达50 h,镓熔点的复现性为0.1 mK,闭口结构与开口结构镓熔点量值差异经过气压修正后由0.13 mK减小至0.06 mK,镓熔点温度-气压线性拟合曲线所得数值与90温标中给出的镓熔点气压修正系数一致.

期刊

计量学镓熔点气压修正开口型结构国际温标

深度强化学习研究综述

其他学术论文