基于深度强化学习的水下机器人导航算法研究

来源 :广东海洋大学 | 被引量 : 0次 | 上传用户:wang840911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于陆地资源在不断枯竭,许多国家将目光转移到具有丰富矿产资源、渔业资源的海洋。智能水下机器人可自主实施水下环境中海洋资源的开采,避免人工水下作业带来的安全风险,而水下机器人的自主导航能力是其能够顺利实施水下作业的重要前提。针对常规的自主导航算法在复杂的水下环境中存在运算量过大、无法实现实时导航,而强化学习则会遭遇维度灾难、需要花费大量时间来训练学习等问题,本论文提出了采用改进型的DDQN算法来研究水下机器人在未知环境中的自主导航,该算法赋予了水下机器人自主学习的能力,提高了机器人在不同环境中工作的自适应性,解决了传统自主导航算法的瓶颈问题,实现了水下机器人在无地图信息环境中的自主导航。水下机器人自主导航可以分解成为两个子任务:局部避障和全局导航。因此本文提出了一种模块化的神经网络架构,主要包括局部避障神经网络模块和全局导航神经网络导航模块。局部避障神经网络模块用于引导水下机器人远离障碍物;全局导航神经网络模块用于引导水下机器人以较短的路径趋向目标位置。常规的DDQN算法的奖励值只能影响到相邻状态的状态-动作Q值,本文提出的多步机制DDQN算法(Mu Lti-step DDQN,MS-DDQN),实现了将奖励值的影响向后几个状态的状态-动作Q值延伸,提升了水下机器人感知未来状态信息的能力,使得水下机器人具有更强的导航避障能力。为了加快深度神经网络的收敛速度,以及使得水下机器人能够学到最优的路径导航策略,提出了一种新的连续组合奖励函数。在原来奖励函数的基础上添加了方向奖励和危险奖励,通过这两个奖励使得机器人远离障碍物和朝着目标位置前进。本文中采用几何法来描述障碍物环境信息,并对障碍物进行相应的膨化处理,进而可将水下机器人视为一个质点来处理。本文使用Python语言和Pygame库构造训练仿真环境模型和仿真水下机器人模型,并采用主流的深度学习框架Tesnorflow搭建本文提出的模块化神经网络结构。最后,采用MS-DDQN算法在仿真水下环境中训练水下机器人的自主导航模型。通过将水下机器人在不同的测试环境中进行测试,对比分析实验结果,证明了所提出的MS-DDQN算法比传统DDQN具有更高的学习能力和更强的泛化能力,基于MS-DDQN算法的水下机器人可在不同未知复杂环境中实现自主导航,而不用针对新的环境重新训练。
其他文献
近年来,随着物联网应用的快速发展以及市场需求的增大,传统的物联网无线通信技术如Wi-Fi、蓝牙、Zig Bee等已经无法满足大规模应用部署的要求。物联网低功耗广域网LPWAN(Low-
基于表面等离子体共振的光纤传感器是一种新兴的传感器,其具有高灵敏度、高分辨率、响应速度快、抗干扰能力强等优点,在环境监测、生物医学等领域具有很广泛的应用前景。本文
随着计算机网络,通信技术和电子技术的快速发展,信息传播已经取得迅猛的发展。其中数字图像和视频作为信息的主要载体,是人类获取和交换信息的主要来源。数字图像的相关研究
电容层析成像(Electrical Capacitance Tomography,ECT)技术是自20世纪80年代借鉴医学CT技术发展起来的一种成本低廉且安全性能高的新型流动层析成像技术。它可以在不破坏封
无线可充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)中,如何设计合理的路由协议,关系到节点能量动态平衡以及数据传输路径稳定性,进而影响网络的生命周期。
随着互联网信息技术的发展,各种网络服务层出不穷,使得互联网体系结构中的僵化问题日益严重。网络虚拟化技术可以使得在不改变底层物理网络架构的情况下,让多重异构的虚拟网络成为可能,现已成为解决未来网络架构的重要因素。作为网络虚拟化技术的关键,近年来对基本网络切片问题即单域虚拟网络映射问题的研究已取得了一些瞩目的成果,但随着网络服务的更新换代,单域网络片逐渐无法应对人们的需要。底层跨越多个自治域的网络切片
随着大数据技术的快速发展,用户拥有的数据量越来越大,这些海量的数据可能会超出个人用户所拥有的存储能力,导致用户难以实现将海量数据完全存储到本地这一目标。在这种背景
内生经济增长理论认为,创新是经济增长的内在源泉和不竭动力。近年来,以资本要素投入、资源环境消耗为代价的经济发展方式已经无法满足我国经济持续健康发展的需求。优化经济
在机械制造的自动化背景下,轴类零件安装间隙的快速重复检测是机械行业内的一类重要研究课题。目前,国内大多数企业对于轴类零件安装间隙的检测主要依赖人工完成,人工检测成
随着高性能计算在科学研究和海量数据处理中广泛应用,对高性能计算软件环境的完善成为了人们关注的焦点。编译技术作为软件和硬件连接的桥梁,对高效的编译技术的研究越来越受