基于深度强化学习的视觉导航方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:cunkjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足各种专项需求,智能机器人首先需要完成一些基础的任务,而实现自主导航则是其中一种。通过视觉进行自主导航,可以使机器人摆脱对场景地图的依赖,更快速的进行任务部署以及任务拓展。然而视觉信息冗余度高,处理困难,且使用传统算法先建模然后再设计导航控制器的难度很大。近年来快速发展的深度强化学习方法为免模型的机器人视觉导航任务提供了一个新的研究思路,但在视觉导航领域,还存在着样本效率低下,训练困难以及容易过拟合到当前导航场景等问题。本文分别从提升导航性能以及导航场景泛化能力的角度构建基于深度强化学习的视觉导航方法,并训练导航智能体完成端到端的视觉导航任务。使用强化学习方法解决视觉导航问题普遍存在奖励稀疏以及样本效率低下的问题。针对奖励稀疏问题,本文提出了基于逆模型辅助任务的特征塑造方法,以自监督学习的方式加快智能体的训练过程。该方法直接对原始的状态输入进行特征塑造,保证了智能体在当前训练环境中的导航性能。针对样本效率低下的问题,本文提出了一种基于样本增强的多个目标协同训练机制,缓解当目标增多时需要的训练样本数目急剧增加的问题。拥有场景泛化能力的智能体在面对新的导航场景时,不用重新训练或者只对其进行微调便可以直接完成导航任务。因此完成多场景多目标下的视觉导航任务最便捷的方法是首先在部分场景下训练出泛化能力强的模型。针对智能体在不同导航场景下的泛化问题,本文基于模块化网络设计的思想,设计了两种适用于室内导航场景的自监督辅助任务模块:基于路径闭环检测的网络模块设计,训练智能体判断当前状态是否为经历过的状态;基于状态-目标匹配的网络模块设计,训练智能体判断当前的状态与目标状态之间的差异。本文在AI2-THOR导航仿真平台上对上述提出的解决方案中的不同模块进行消融实验,并在最后测试使用整个解决方案训练的智能体对于新的导航场景的泛化能力。最终证明提出的模型能更快地训练出导航性能及泛化能力更好的智能体。
其他文献
利用1948~2016年的NCEP/NCAR逐日大气再分析资料,采用多种气象诊断方法,本文研究了北太平洋冬季大气的低频变化及天气尺度涡旋的作用,并对低频扰动移动性演变特征的主要影响因
金属半固态成型技术被认为是一种极具有潜力的短流程、近终形成型技术,具有巨大的市场需求。通过电磁感应制备半固态坯料的工艺参数难以获得,运用有限元模拟分析试样的电磁场和温度场,为确定和调整电磁感应的最佳工艺参数提供了一种行之有效的手段。本文以定量AZ80M的圆柱形坯料为研究对象,利用有限元分析程序ANSYS对不同功率下坯料在高频电磁感应作用下试样内部的电磁场、温度场进行了模拟,研究功率和半固态坯料金相
胶合板是由奇数层单板经胶粘剂胶合而成。我国的胶合板质量参差不齐,整体质量较低,其中重要的影响因素就是单板的外观质量,所以对单板的外观质量进行检测评价是提升我国胶合板质量的关键。单板外观质量在线检测系统高效、准确以及评价方法合理是该领域中的研究热点,因此本课题进行了相应的研究。本课题开发了 一套基于机器视觉的单板外观质量在线检测系统。首先搭建了机器视觉检测系统,并采集了大量单板图像,建立样本库。其次
理解和分析人体目标是智能监控视频(图像)处理系统的核心功能,在安防等领域有着迫切的现实需求和广阔的应用前景,同时也是计算机视觉领域最热门的研究方向之一。本文以视频或
蓝莓为杜鹃花科(Ericaceae)越橘属(Vaccinium)多年生灌木或小灌木。蓝莓具有极高的营养价值和保健价值,市场潜力巨大。蓝莓的种植对栽培环境要求比较苛刻,因此培育出具有抗性
卤素钙钛矿材料凭借着突出的光电性能,已经吸引了人们的关注。近年来,钙钛矿太阳能电池的器件效率已经突破23%。但是,由于铅基(Pb)钙钛矿材料的稳定性与毒性问题阻碍其进入商业化发展,因此,解决钙钛矿材料的稳定性与降低Pb的毒性显得尤为重要。在本论文中,将碘化钾(KI)添加至钙钛矿前驱体中,改善薄膜形貌,提高结晶性制备出既稳定又高效的器件。借助电子扫描显微镜(SEM)、紫外可见吸收光谱(UV-vis)
随着3D传感和数字化设计技术的发展,在企业的数据库和互联网中已经存在大量的三维模型。为高效地组织和重用已有的三维模型,需要自动识别模型的类别并能在数据库中检索出相似
随着科技的进步和信息技术的快速发展,越来越多的传统企业摒弃了单一的传统零售渠道,开始在原有基础上开辟网络直销渠道来销售产品,双渠道模式已经成为普遍现象。在双渠道供
随着城市发展对城市用地量需求的不断增加,城市可供建设的用地供需量之间的矛盾也愈渐突出,作为城市中重要的开发资源,地下空间资源在城市规划发展中的效用越来越高。地下空
随着科学技术的不断进步,电机的设计与制造正向高速、高精度和高可靠性的目标发展。电机作为大部分自动化设备的动力元件或调整元件,扮演着举足轻重的角色。电机由于高温、油污、过载等恶劣的工作环境和制造与装配的误差等因素,电机的运行将伴随潜在的风险,某些重要的电气设备一旦发生故障将产生巨大的损失,危及人员的生命安全。因此,电机运行过程中的信号监测与故障诊断显得尤为重要。传统的电机故障诊断方法是建立在一些可观