论文部分内容阅读
优化与控制一直是跨学科研究的一个基本问题。而这个问题的传统方法是集中式的。由于在许多现实世界的应用中可扩展性,可靠性和有效性,对于优化与控制最近的研究集中在分布式解决方案。在分布式系统中资源优化与控制问题的主要目标是为了每个代理设计局部控制规则以确保相对于一个给定的系统级目标而言全局行为是可取的,在许多系统中通过耦合约束代理的行为使得优化与控制设计更加复杂,本文使用博弈论来解决这类问题。博弈论优化与控制是一个很有前途的分布式资源分配的新方法,在博弈论优化与控制下的分布式资源分配中每个代理有着共同的利益目标----最大化全局目标函数。如果博弈被设计为一个势博弈那么学习动力就拥有固有的鲁棒性,并且学习动力作为一类广泛的分布式学习算法在多种信息的依赖下可以收敛到一个纯粹的纳什均衡。 本研究主要内容包括:⑴描述了博弈优化和控制如何可以被看作是具有一种内在的分层体系,并使用一种简化控制设计的模块化框架。这种框架以势博弈为接口,包含了效用函数设计和学习动力设计。本文研究的分布式问题的解决方案由此框架展开。⑵给出一个博弈论优化方法分布式的求解数独问题,首先为其建立效用函数并证明数独问题可以转化为势博弈模型,然后使用学习动力逐步优化参与者的状态以达到势博弈的最优状态即纳什均衡点。势博弈现有大部分研究结果限于计算机仿真,没有实现真实的物理博弈,为此给出数独问题一个物理的博弈实现。⑶介绍了基于势博弈合作控制的动态环境,将通过两个例子问题进行说明。第一个是移动目标追踪问题,采用的学习动力将考虑两个方面:一个是依据该问题当前策略集与前一个策略相关性,另一个是通过利用策略的惯性来减少每个参与者的计算量。第二个是机器人路线选择问题,该问题中多个机器人面临随机生成的动态目标环境,各自选择自己的路线以适应动态变化的环境。计算机仿真表明势博弈的动态优化是可行和有效的。