论文部分内容阅读
决策是当前人工智能和机器人领域的关键问题,它的涵义十分广泛,从逻辑推理、专家系统到多主体协作、多主体对策、实时规划、机器学习等各种领域,都属于或涉及到智能决策的问题。而作为人工智能的载体——机器人,其智能决策的研究也代表着将来的发展方向,有着重要的实际意义。
随着机器人传感器技术、计算能力、控制技术等的不断进步,机器人特别是机器人团队的决策问题越来越成为一个热点问题。机器人的团队决策问题经历了从无到有、从简单到复杂的演变。现在,在实体机器人领域,有关机器人团队决策问题主要集中在三个方面:机器人足球团队对策、机器人队形控制和机器人合作追捕。这三个方面要解决的问题互不相同,但都有其共性,那就是对团队合作的初级阶段——队形的优解的研究和探索。
目前对于实体机器人团队队形的生成方面主要有三种方法:个体基于角色的站位的方法<[1]>,整体基于队形选择的方法<[2]>和角色基于目标的站位方法<[3]>。这些方法从不同的角度提供了对队形的静态选择,但是不能够灵活的适应多变的环境。在实体机器人团队队形控制方面的主要研究角度是维持队形,主要方法是通过leader-follower方法或其他如virtual structure的方法维持队形的不变。但对于在动态环境中越来越重要的队形切换方面的研究很少,一般采用人工势场的方法进行队形切换,这种方法没有综合考虑环境的动态性,并且存在着人工势场的一些固有弊病如死锁等问题。
本文以四足机器人足球项目为基础,在队形的动态选取、队形的动态切换以及机器人避障跑位方面分别提出了新的方法和应用。在队形的动态选取方面,首先采用了扩展的卡尔曼滤波的方法对于目标的速度和运动方向的获取进行优化,然后应用到预测模型中,实现了基于预测的队形选取策略;然后采用模糊综合评判的策略,融入了队伍意向的概念,进一步丰富了队形的选取,并且使其动态化,对动态环境具有较强的适应力。在队形的动态切换方面,采用了MDP的方法,对队形切换过程中遇到的障碍物阻拦等情况做了全面的考虑,实现了队形切换策略的动态化,并且使用动态规划的方法减少额MDP求解中的迭代运算,使得队形切换实时性得到提高。在机器人避障跑位方面,提出新的多目标的理念,将机器人避障跑位中遇到的限制作为目标,在强化学习的基础上利用模糊多目标决策的方法,加快了强化学习的学习速度,并且获得了更优解。
本文在四足机器人平台上设计了数个实验,分别针对基于预测的队形选取、队伍意向的融入、基于MDP的队形切换和基于模糊多目标决策的机器人避障跑位四个问题进行了测试,实验的结果表明,本文所提到的方法,能够从一些方面提高系统的性能,优化系统的解。