基于深度强化学习的AUV路径规划方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:a9y3s118x3f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
辽阔的海域不但蕴含着丰富的资源,而且还是贸易与文化的交流要道。大力发展海洋装备是提升我国海洋开发和管控能力的必要手段。自主水下机器人(AUV)作为一种探索开发水下空间的无人航行器,具有体积小、高速、智能、较好的隐身、无人伤亡等优点,能够出色完成各种科学考察和工程任务,有广泛的应用和重要的研究价值。本文以AUV为主要研究对象,从AUV自主航行时规避障碍物的策略出发,分别重点研究了静态环境下AUV路径规划问题和动态环境下AUV路径规划问题,具体内容如下:
  首先,介绍了本文的研究背景及意义,分析了常见的路径规划算法的国内外研究现状。针对海洋环境的复杂多变性,将强化学习算法应用到AUV路径规划中,基于该算法提高AUV的环境自适应性和自学习能力。
  其次,基于Actor-Critic算法进行了静态环境下AUV路径规划问题的研究。针对该算法在收敛速度方面的不足,本文提出了一种自适应学习率调整策略:考虑不同维度的学习率变化差异,根据累积梯度下降和当前梯度下降的信息,综合起来动态更新当前时间步的学习率。用自制训练地图进行训练,训练结果表明,该学习率调整策略有效提高了原算法的收敛速度,而且优化后算法的在收敛稳定性上也有所提升。
  然后,针对动态环境下基于Actor-Critic算法,AUV在训练初期存在学习效率低和学习过程震荡的问题,本文提出多评论家行动者深度强化学习算法。多个评价家分别根据不同标准对Actor所选择的动作做出评价,然后通过评价融合形成一种综合评价,以解决单一评论家存在的评价耦合问题。通过定性和定量对比分析实验结果,该方法具备在线学习能力,并可以提高学习效率,满足AUV动态环境下路径规划的实时性和环境适应性需求。
  最后,简要介绍了半实物仿真平台的概念及意义,所开发的路径规划系统软硬件结构。叙述了半实物仿真实验流程,以及两种算法在半实物仿真中的实验结果,由此证明了本文所提出的AUV路径规划方法的可靠性和实时性。
其他文献
M型艇是一种在航行阶段利用静浮力、水动升力和空气静升力的新型高性能滑行艇。与其它复合船型不同在于M型艇拥有独特形状的滑行槽道,在滑行航行阶段(Fr_▽>3),除了利用水动升力外,还利用首兴波的能量产生空气静升力抬升船体,从而大大减少了兴波阻力。在实际应用过程中,首兴波能量的消耗可以减小M型艇在航行过程中对两岸河道及过往船只的兴波冲击作用,帮助M型艇突破航道对航速的限制。滑行槽道还会对槽道内的
学位
在极地开发、航运及科考的新浪潮下,极地海域航行船舶的数量和频率日益增加,由船-冰碰撞所导致的船体结构损伤风险也日益突出。尽管船体与巨型浮冰的碰擦已确立为极地船舶船体板架结构的设计载荷情形,然而许多基础性的科学问题仍未得到充分考虑与解决,具体体现在:1)船-冰碰擦事件的完整观测受到现场诸多因素的限制,而相应的试验模拟方法仍存在缺失;2)碰撞载荷具备高度非线性的时空分布与演变特征,而现有研究尚未建立针
学位
舰船定量声学设计是当前及未来推进舰船安静化进程的重要技术手段。准确的振动噪声建模计算方法和特性分析是舰船定量声学设计的基础和关键。舰船的壳体通常由不同几何形状的板、壳单元组合而成,系统庞大。现有的分析手段常拘泥于有限元法、边界元法等数值方法,且存在计算时间长、占用空间大、分析频段窄等缺陷,不便于深入的机理性研究。因此,建立一套准确、高效、宽频的耦合板壳结构振动建模方法和分析手段是有效解决以上矛盾的
学位
随着世界各国对海洋探测的需求越来越大,声纳设备的种类也越来越多,如多波束声纳设备、侧扫声纳设备、探鱼声纳设备等。其中侧扫声纳在地貌成像、目标搜寻领域的作用尤为突出,它的主要优点是图像分辨率高、能直观的显示出海底的细微形态且成本较低。由于受侧扫声纳系统的基本原理、测量载体姿态、测量环境等因素影响,其数据失真补偿处理、图像拼接及显示都十分复杂。为了能较好地得到真实的海底地貌图,侧扫声纳的显控及信息后处
学位
随着全球气温的升高,极地地区的海冰开始大面积消融,导致冰覆盖面积逐渐减小,因此越来越多的国家开始关注极地航道的开发。当船舶在极地航行时,海面上的浮冰对主动声学设备具有强烈的声散射作用,这些散射带来的混响干扰对冰下主动声源设备的性能有较大的影响,因此对漂浮海冰的散射特性的研究是船只在极地地区能否正常工作的前提条件。  漂浮于极区海面上的海冰,讨论其声散射问题时,在物理模型上可以看作为界面附近的目标。
学位
近年来,摆线推进器由于其优良的操纵性能越来越受到人们的广泛关注。摆线推进器通过改变偏心点的位置来改变推力方向,具有操纵性好,抗风浪能力强,响应速度快等特点。摆线推进系统在诸如拖船,渡船等高机动船上是很有效的,它能够产生水平面上所有方向的推力。当成对使用时,可以使船只能够执行诸如侧向移动、原地回转等操纵难度较大的操作。摆线推进器工作时叶片以自转和公转并存的形式多自由度运动,叶片间的水动力干扰是十分复
随着近年来经济的日益增长,海上石油开采及石油运输变得日益频繁,海上石油泄露事件频发,不仅破坏了海洋生态环境,使得大量海洋生物死亡,而且对近海居民的健康造成了巨大的危害。并且,在清理溢油的过程中,溢油挥发使得参与清理溢油的人员的身体健康受到了不同程度的危害。故本文中,提出一种利用双无人艇进行协同溢油围捕的方法,既可以有效清理溢油,又可以在很大程度上减小甚至避免溢油对清理工作人员健康的危害。  首先,
学位
有效合理的开发、探测海洋资源是摆在我们面前的一个挑战和机遇。在复杂多变的海洋环境下,无人艇区别于无人机、移动机器人的适用性进一步得到凸显,其发展越来越受到国内外学者的关注。无人艇的路径规划也成为了其发展过程中必不可少的关键环节,其目的是通过优化算法规划出最优的路径。  在该领域积累了大量的规划算法,主要包括A*算法、快速行进法、人工势场法、遗传算法、蚁群算法、快速扩展搜索随机树等。上述算法存在信息
在船舶与海洋工程等多个领域(例如水下爆炸、海底资源勘探、含沙流当中的空化现象、螺旋桨等推进装置的空化、超声波清洗、医学治疗)中,气泡与结构物的非线性耦合作用均有着重要的应用。脉动气泡与自由液面上浮体的耦合作用是非常值得研究的基础性课题,同时也是气泡动力学领域中尚未攻克的薄弱方向。本论文着眼于气泡与浮体的非线性耦合作用,通过将实验与数值联合的方法展开研究工作,基于边界积分法(BIM)建立数值计算模型
随着舰船的现代化设计不断向着轻量化、大型化以及快速化方向发展,船体产生的振动噪声问题也是越来越严重,舰船的振动与噪声不仅在很大程度上影响了船员的日常工作效率及生活质量,并且也会对船体结构的稳定性产生影响。久而久之,船体的振动可能造成船体结构疲劳破坏,这会大大缩短舰船可使用年限,因此,针对船舶的减振降噪研究一直是一个热点问题,如何科学的对船体结构进行有效的声学优化也变得非常重要。国内现有的船舶声学设
学位