深度确定性策略梯度(DDPG) 相关硕士博士期刊学术论文 - 搜论网

深度确定性策略梯度(DDPG)相关论文

基于深度强化学习的车辆自主避撞决策控制模型

为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决......

期刊

车辆安全自主避撞深度确定性策略梯度(DDPG) 控制模型多目标奖励函数

序列多智能体强化学习算法

针对当前多智能体强化学习算法难以适应智能体规模动态变化的问题,文中提出序列多智能体强化学习算法(SMARL).将智能体的控制网络......

期刊

多智能体强化学习深度确定性策略梯度(DDPG) 序列到序列(Seq2Seq) 分块结构 Multi-agent Reinforcement Learn

看过本文同时还关注