论文部分内容阅读
在分布式多机器人系统协同应用中,机器人系统需要协同完成共同目标。然而随着机器人规模的扩大,环境广域化分布,机器人通常只能获得环境的部分观测,机器人间的信息共享成为了提高团队协同效率的关键。考虑到实际应用中通信通常是有代价的,机器人系统如何做出合理的信息共享决策,在通信获得收益与通信代价之间权衡是一个很重要的问题。然而现有信息共享算法或因只考虑信息覆盖而过度通信,或因应用于大规模机器人团队时计算复杂度剧增,不适用于分布式多机器人协同环境。在本文中,我们分析了多机器人系统协同决策过程两个阶段:信息共享决策和行为决策阶段。在信息共享决策阶段中,以达到有效信息覆盖作为目标,从而从两个阶段中分离出来作为独立的过程。在本文中,我们将信息共享阶段建模为一个Dec-MDP过程,以充分考虑信息共享过程的多种不确定性。考虑到Dec-MDP的高计算复杂度,以及在实际应用中很难有充足的资源和时间用于计算,本文中我们提出基于矩阵的信息共享模型,该模型采用简洁的矩阵表示信息共享决策过程涉及的数据结构,与Dec-MDP模型等价。因为矩阵运算高度并行的优势,该模型支持并行度更高的决策方法,可以更快速的求解策略。然而矩阵模型中,最优解的求解需要考虑联合行为,求解复杂度依然很高。在本文,我们针对三种通信方式,以局部最优代替全局最优,分别提出基于矩阵的近似信息共享算法,包括:信息共享决策和启发式模型维护算法两个部分。在基于矩阵的信息共享近似算法中,我们只需要其中四个矩阵简单建模信息分布情况,网络连接情况,信息关联情况和通信消耗情况,便可以通过简洁的矩阵运算代替复杂的逻辑推理,使得运算效率更高。在实验环节,我们设计了支持三种通信方式的实验平台,在广播通信方式和点对点通信方式下部署本文提出的基于矩阵近似信息共享算法,与现有的一些算法进行比较。经过验证,我们的算法对机器人规模变化,信息密集程度变化有很好的扩展性,能以尽可能少的通信消耗达到很好的信息共享目的。