确定性行动者-评论家相关论文
近些年来,深度强化学习算法在很多强化学习任务上取得了令人瞩目的表现。深度强化学习算法集合了深度学习的表征能力和强化学习的......
学位
连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习的发展以及确定性策略梯度(deterministic policy gradients, DPG)......