论文部分内容阅读
自主移动平台以其无人系统下具有海上作业、陆地搜索、空中侦查等优点,在海洋资源开发、海防建设等方面发挥越来越多的作用。而移动平台具备较强的运动规划系统,能够自适应环境,对完成作业任务十分重要。本文主要针对无人水下航行器(Unmanned Underwater Vehicle, UUV)的自适应运动规划问题,结合人工势场法和强化学习方法,开展了对UUV在环境中的规划与学习研究,对于自主移动平台自适应运动规划与学习方法研究具有重要理论与实际意义。首先,概括UUV在环境中的运动规划的研究现状及常见方法,针对人工势场法动态规划所存在极小值和目标不可达问题,提出设计优化偏转角等改进方法,通过仿真实验验证了改进方法的可行性。其次,针对静态环境下UUV的运动规划问题,将强化学习方法引入人工势场运动规划,根据静态环境建立模型,结合观测的环境信息划分了状态空间和动作空间,设计强化函数。通过仿真实验证明了 UUV在静态环境中的运动规划具有自适应学习能力。再次,针对动态环境,基于预测思想设计了障碍物的避碰范围层,提出UUV的运动评价方法。在强化学习方法中引入资格迹(Eligibility trace),并改进了强化学习方法的信度分配问题,仿真实验结果表明,该方法具有在动态环境中的自适应避障规划和学习的优点。最后,采用自主移动机器人(UGV)模拟UUV验证水平面自主运动规划方法,设计了典型环境案例,通过UGV所配置的传感器和自主控制器完成未知环境下自适应运动规划,以便验证所研究方法在未知环境下实现自主规划的学习能力。验证了人工势场和强化学习相结合的运动规划算法的有效性和可行性,试验结果表明所开发的规划系统,自主移动平台可以完成对环境的不断强化学习而得到更好的自适应运动规划。