论文部分内容阅读
近年来,随着研究的不断深入,移动机器人领域的相关研究已从避障、跟随等简单实验环境下的演示示范逐步走向巡逻监视、协同编队、自动驾驶等真实场景下的实际应用。其所面临的工作环境也从二维结构化的简单静态场景,如扫地机器人面临的室内场景,逐步深入到三维非结构化的复杂动态场景,如无人驾驶车辆面临的城市交通场景等。其中,自主导航技术是支撑移动机器人完成上述复杂任务的核心基础模块。传统的移动机器人自主导航系统通过模块化划分,将整个复杂的自主导航问题分解为定位、感知、规划、决策、控制等多个单一的子问题,进而利用多个子模块分别进行解决,在简化问题形式的同时也便于模块的并行化开发。然而,传统模块化的自主导航方案,特别是其决策和控制模块,面对复杂且动态多变的工作环境,在执行监视围捕、协同编队、自动驾驶等自主性要求较高、任务形式较为复杂的自主导航任务时,其决策的灵活性、控制的实时性以及决策控制策略对任务场景的迁移学习能力存在较多问题,使得此类任务距离实际应用仍存在较大差距。造成传统模块化方案从简单实验场景迁移至实际任务场景时失败的原因,除单机器人个体在感知、机动能力上的固有不足之外,其核心原因主要在于:(1)首先,现有模块化方案中基于固定规则的行为决策方法缺乏与周围动态目标交互关系的建模,仅能处理某些已知的简单场景。而面对未知动态环境下包含多异构个体的任务形式,如监视围捕任务中通常包含监视机器人、可疑目标等多个异构个体,且不同个体间兼具合作、对抗等复杂的交互关系,此时仍旧采用传统基于规则的决策策略很难适应环境的动态变化,造成系统决策的灵活性、自主性较差。(2)其次,面对具有实际应用背景的复杂问题,相关研究倾向于从控制理论的角度对其进行理想化建模,以期保证理论上的完备性,而忽略了实际环境中存在的诸多约束。如在多机器人协同编队任务中,基于经典控制理论的控制方法在应用于具体任务时需要在理论层面之外重新考虑相关约束,导致算法的实时性、环境适应性面临较大挑战。(3)最后,传统模块化的问题分解方式使得决策控制模块缺乏对整体任务指标的清晰认知,且各独立模块间的输出结果难以实现深度融合,造成系统的综合推理能力较差。并且,传统基于模型的决策控制机制对环境的感知理解能力较差,在面对自动驾驶等复杂多变的任务场景时,系统无法通过学习实现模型的场景迁移。为实现移动机器人从简单实验场景到实际任务场景的有效迁移,着重解决传统模块化方案中决策、控制模块在实际任务中存在的诸多限制,本文分别从三种典型的实际任务场景出发,对复杂动态环境下移动机器人所涉及的相关决策控制问题进行了深入研究。具体研究内容如下:(1)针对基于固定规则的行为决策方法缺乏对周围动态目标交互关系建模,导致系统的灵活性、自主性较差的问题,本文以实际场景下的多机器人协同视觉监视围捕任务为切入点,首先利用多个机器人个体,实现了大范围监视场景下的多机器人实时协同感知,克服了单一机器人个体感知能力的不足。其次,基于博弈理论对监视场景下的多个体间涉及的合作、对抗等复杂的交互关系进行了博弈形式建模,并通过综合考虑系统整体任务指标与个体利益指标进行博弈模型的求解,实现了多机器人个体的实时动态决策。最终配合运动控制算法实现了监视场景下对可疑入侵目标的合作围捕。该算法通过构建一整套深度融合的感知、决策、控制算法,克服了传统基于固定相机的视觉监视系统在移动性和自主性上的不足,同时也证明了基于博弈的决策策略在模块化方案中灵活应对复杂任务场景的潜力。(2)针对基于经典控制理论的控制方法应用于实际任务时其算法实时性、环境适应性较差的问题,本文以多机器人编队问题为实际任务背景,首次尝试从数值优化的角度对传统编队控制问题进行重新建模,将编队控制问题建模为非线性优化问题。进一步通过引入非线性优化求解算法并结合传统控制方法,设计了多种具有实际应用背景的多机器人协同编队算法。最终借助于优化算法的快速收敛特性并结合自动化参数搜索,本文提出的协同编队算法能够根据具体场景实时自动调优,提升了移动机器人在实际编队任务中的实时性和环境适应性,同时验证了将优化理论引入传统模块化控制方法对系统实时性的提升。(3)针对传统基于模型的模块化导航方案缺乏完善的输出融合机制,模块间的松散耦合以及对环境感知能力的不足导致系统在复杂环境下的学习、推理、场景迁移能力较差的问题,本文从时空数据驱动的角度对移动机器人自主导航中的决策控制策略学习问题进行了研究。通过构建多种兼具时空信息的策略学习数据集,分别设计了多种基于时空信息的端到端决策控制策略深度学习模型,促进了感知、规划、决策、控制模块的深度融合,增强了自主导航系统在复杂环境下的环境感知、学习推理以及场景迁移能力。基于上述改进和创新,本文分别从博弈决策、优化控制的角度提升了现有模块化导航方案在监视围捕、协同编队任务中决策的灵活性和控制的实时性,从时空数据驱动的角度改进了基于学习的导航方案在自动驾驶任务中的感知、学习和推理能力,为移动机器人在复杂动态场景下完成其他实际任务提供了参考。