逆向强化学习相关论文
深度强化学习是指利用深度神经网络的特征表示能力对强化学习的状态、动作、价值等函数进行拟合,以提升强化学习模型性能,广泛应用......
针对水而无人艇(USV)在复杂海洋环境下执行任务时需要用户进行干预的问题,本文提出了基于逆向强化学习的行为模仿学习方法.该方法......
集装箱码头装船时堆场翻箱具有时序性与动态性,属于NP(non-deterministic polynomial)难问题。针对常见的顺岸式集装箱码头堆场,以......
近几年来,强化学习和学徒学习作为机器学习的两个子领域得到了极大的发展。在目前的强化学习技术中,报酬函数的自动构建是迫切需要......
舰载机牵引车是航母甲板上重要的“工程车辆”,对舰载机有效利用航空燃油起着关键作用;在非起飞状态下的舰载机舰面运动中,无论是舰面......
无人驾驶智能汽车系统是一个集信息感知、自动路径选择与驾驶行为规划等能力于一体的综合智能系统。工业信息技术的飞速发展,推动......
水面无人艇(unmanned surface vehicle,USV)是一种无人操作的海洋自主式船只,具有一定的自适应能力。近些年随着无人系统的应用越......
强化学习是机器学习领域内的研究热点,主要用来实现决策优化。首先介绍了强化学习的基本原理和经典算法,包括基于值函数的强化学习算......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
逆向强化学习是指通过专家行为获取潜在报酬函数的过程,进而可利用强化学习等优化理论得到最优的控制策略,因而可以实现对专家行为......
随着机器学习算法的发展,自主驾驶技术不断向前推进,将对未来的城市交通产生重要影响。自主驾驶任务的核心在于决策与控制算法,传......
针对陆军分队战术决策问题,在分析深度强化学习技术优势及其解决分队战术智能决策适用性基础上,建立了基于马尔可夫决策过程的陆军......
针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示......