论文部分内容阅读
多智能移动机器人协作是当今热门研究议题。论文主要探讨对抗性环境下多智能机器人协作的相关问题。对抗性问题的特点是参与方之间存在利益冲突,参与人一般会主动去阻碍对手实现目标。机器人竞赛和军事等诸多需求使得进行该项工作具有现实意义。论文以中型足球机器人为研究对象。机器人足球对抗是球队中各机器人根据态势任务要求进行自我时空配置和执行自身行为如运球、踢球等的过程。论文首先回顾了中型自主式足球机器人的研究现状和多机器人协作涉及的关键技术,如智能系统设计、协作机制和行为生成、环境感知等。默契的团队配合有两个前提条件,一是各机器人拥有一致的准确的全局环境信息感知;二是针对各种对抗态势,各机器人对战略战术、协作机制和行为生成等都具有事先的约定或默契。因此,论文主要研究合作环境感知、协作机制和行为生成,工作成果如下:针对环境感知议题,因当前机器人个体难以只依靠自身传感器信息建立起准确的全局环境信息模型,提出了一种多机器人合作感知对抗环境全局的方法:各机器人先分别融合视觉和里程计信息实现较精确的自定位;接着根据自定位信息,各机器人分别获得各自所看到的对象分布;在信任各机器人自定位信息的前提下,通过传感信息共享,多机器人先合作识别出队友和获得队友的位姿及行为状态,然后识别出对手等其它对象的身份并确定它们的分布,从而建立起全局的环境信息模型。对象身份识别和位置分布估计主要通过将来源于各机器人的传感信息应用聚类分析等方法实现。探讨了两种环境建模水平下的多机器人协作机制和行为生成技术:一是机器人能获得自定位和队友的位姿信息及对手的粗略方位信息但无法确定对手运动状态;二是机器人能获得队友与对手等的位姿和当前行为状态的环境感知水平。针对当前的机器人环境感知水平,设计了一种中型自主式足球机器人的决策算法流程:各机器人首先各自判断对抗态势类别,确定球队当前任务;然后根据既定战略和规则,估计当前态势下各角色的合理承担者和它们的合理行为决策;最后选择执行自身行为。实践中需事先分析可能出现的态势类型和相应的合理的团队任务,制定出角色分配规则和行为产生方法等。设计时要注意各种态势转换过程中角色和行为的平滑性和一致性。根据足球对抗的特点,提出了一种结合动态角色分工与区域防守的团队协作机制,实施了基于阵型的团队组织机制。球队通过阵型配置、进攻线路安排及进攻线路转移等实现团队战术配合。因在对抗中必需协调好防守和进攻两方面的任务,提出了一种双leader型的球队阵型组织和控制方法:由守门员或后卫根据具体态势牵头构建防守阵式,由当前最紧要队员承担主动拦截抢球或主动进攻的leader角色来组织进攻阵式。根据足球对抗和角色分工的特点,应用局部协调方法,提出了一种团队任务紧迫优先的规划算法。针对第二种环境感知水平,提出和分析了一种以量化分析为基础的基于短期预测的对抗规划方法。它假设机器人不知道对手是否理性,基本算法流程为:先预测出在某些短期未来时刻点的对抗双方的可能状态组合;然后评估出己方各种状态组合下的期望收益,并据此建立决策树;最后根据决策树进行行为决策。因特定态势下机器人一般只执行特定行为,论文引入了行为偏好的概念。结合基于短期预测的思想,提出了一种自适应的对抗规划方法:通过不断修正对对手行为偏好的估计,更好地把握对手的行为决策,从而使行为决策能在对抗活动中不断合理化。此外,初步开发了一种图形化的行为和编队编辑系统。实践实验和仿真结果证明,所探讨的理论和方法具有一定的有效性和合理性。