逆向强化学习相关硕士博士期刊学术论文

逆向强化学习相关论文

深度强化学习研究综述

深度强化学习是指利用深度神经网络的特征表示能力对强化学习的状态、动作、价值等函数进行拟合,以提升强化学习模型性能,广泛应用......

期刊

深度学习强化学习深度强化学习逆向强化学习基于模型的元学习

基于强化学习的水面无人艇危险规避方法

针对水而无人艇(USV)在复杂海洋环境下执行任务时需要用户进行干预的问题,本文提出了基于逆向强化学习的行为模仿学习方法.该方法......

会议

水面无人艇危险规避专家示教模仿学习逆向强化学习回报函数

基于逆向强化学习的装船时堆场翻箱智能决策

集装箱码头装船时堆场翻箱具有时序性与动态性,属于NP(non-deterministic polynomial)难问题。针对常见的顺岸式集装箱码头堆场,以......

期刊

集装箱码头堆场翻箱智能决策马尔科夫决策过程逆向强化学习

基于逆向强化学习的报酬函数构建

近几年来,强化学习和学徒学习作为机器学习的两个子领域得到了极大的发展。在目前的强化学习技术中,报酬函数的自动构建是迫切需要......

学位

逆向强化学习报酬函数马尔可夫决策环境模型

逆向强化学习研究概述

深度强化学习在可以手动设计奖励函数的领域取得了优异的效果。逆向强化学习利用专家演示数据推断奖励函数,可以有效解决强化学习......

期刊

人工智能深度学习逆向强化学习

基于逆强化学习的舰载机牵引车路径规划研究

舰载机牵引车是航母甲板上重要的“工程车辆”，对舰载机有效利用航空燃油起着关键作用；在非起飞状态下的舰载机舰面运动中，无论是舰面......

学位

航空母舰甲板作业舰载机牵引车路径规划逆向强化学习

夜间无人驾驶智能车的信息感知与驾驶行为规划研究

无人驾驶智能汽车系统是一个集信息感知、自动路径选择与驾驶行为规划等能力于一体的综合智能系统。工业信息技术的飞速发展,推动......

学位

多传感器融合多视角通道三维目标检测逆向强化学习驾驶行为规划

复杂海洋环境下USV自主性提高方法研究

水面无人艇(unmanned surface vehicle,USV)是一种无人操作的海洋自主式船只,具有一定的自适应能力。近些年随着无人系统的应用越......

学位

水面无人艇自主性提高知识库行为模仿逆向强化学习

强化学习研究综述

强化学习是机器学习领域内的研究热点，主要用来实现决策优化。首先介绍了强化学习的基本原理和经典算法，包括基于值函数的强化学习算......

期刊

强化学习深度强化学习元强化学习逆向强化学习决策优化 reinforcement learningdeep reinforcement learningm

基于生成对抗网络与逆向强化学习的机器人汉字笔画书写方法研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

学位

机器人书写生成对抗网络逆向强化学习

基于性能灵敏度的逆向强化学习

逆向强化学习是指通过专家行为获取潜在报酬函数的过程,进而可利用强化学习等优化理论得到最优的控制策略,因而可以实现对专家行为......

会议

性能灵敏度逆向强化学习报酬函数

基于逆向强化学习的自主驾驶技术研究

随着机器学习算法的发展,自主驾驶技术不断向前推进,将对未来的城市交通产生重要影响。自主驾驶任务的核心在于决策与控制算法,传......

学位

逆向强化学习自主驾驶专家演示数据专家监督损失报酬函数

基于深度强化学习的陆军分队战术决策问题研究

针对陆军分队战术决策问题,在分析深度强化学习技术优势及其解决分队战术智能决策适用性基础上,建立了基于马尔可夫决策过程的陆军......

期刊

深度强化学习 MDP 逆向强化学习陆军分队战术决策

基于逆向强化学习的舰载机甲板调度优化方案生成方法

针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示......

期刊

逆向强化学习强化学习舰载机甲板调度优化方案生成

基于创意序列学习的艺术风格学习与绘制系统

在众多传统艺术绘画形式中，笔触是被现代计算机绘画工具（GIMP、Photoshop和Painter）普遍采用的形式之一.创新性地提出了服务于非真实......

期刊

多媒体信息处理序列数据分析图像风格化基于笔触的合成逆向强化学习策略探索

看过本文同时还关注