论文部分内容阅读
随着博弈与控制交叉学科的兴起,博弈论受到了控制领域的广泛关注。基于博弈方法的控制论在多智能体的协同控制、武器分配、电力系统的经济调度等方面得到了广泛应用。然而,利用博弈理论解决控制问题的前提是对博弈系统性质的深入了解,因此对有限博弈的结构性质与演化动态的分析是很有必要的。本文主要以矩阵的半张量积为工具,基于代数状态空间方法,研究有限博弈正交分解、博弈设计、演化动态以及在武器-目标分配问题上的应用。
首先,研究了调和博弈的动态等价性及有限博弈的正交分解。通过推导得到了与基底纯调和博弈动态等价的纯调和博弈的充要条件;针对有限博弈的向量空间结构,分别从对称博弈、零和博弈以及正规化博弈的角度出发,提出了基于对称博弈、基于零和博弈以及基于正规化博弈的三种有限博弈的正交分解方法,并分别推导出了不同博弈子空间的基底;比较分析了向量内积在不同博弈正交分解中的作用,证明了只有当相容性条件满足时,不同的正交分解均可在标准内积下实现。
其次,研究了三种不同类型势博弈的检验与设计问题。针对网络上的分布式博弈问题,提出了基于局部信息的势博弈设计方法,给出了设计只依赖于局部信息收益函数的充要条件;针对网络上具有竞争性质的势博弈,推导得到了检验与设计零和势博弈的充要条件;针对网络上的群体博弈问题,推导得到了检验群势博弈的充要条件,提出了设计群体收益函数的方法。
然后,研究了状态演化博弈学习规则的设计问题。提出了基于两步记忆的非耦合较优响应学习规则,证明了该学习规则在可达条件下能够几乎必然地收敛到状态演化博弈的常返状态平衡;证明了不存在能够收敛到一般状态演化博弈常返状态平衡的多项式时间算法;借助于设计的学习规则,实现了有限博弈纯纳什均衡的求解和时变拓扑下多智能体的一致性。
接着,研究了两类超图演化势博弈的检验与动态特性。针对超图群势博弈,推导了超图上的基本网络博弈为群势博弈的充分条件;证明了在群级联短视最优更新规则下,超图演化群势博弈能够收敛到其纳什均衡。针对策略区分博弈,设计了策略区分逻辑响应学习规则,证明了它的收敛性;证明了当基本网络博弈为二人对称协调博弈时,网络演化策略区分势博弈在策略区分逻辑响应学习规则下,其随机稳定状态是由个体风险占优策略组成的局势。
最后,研究了武器-目标分配问题的博弈方法。建立了武器-目标分配问题的博弈模型;针对网络图联通的通信结构,提出了基于局部信息势博弈的武器-目标分配方法,并通过仿真对比了短视最优响应与逻辑响应两种规则对收敛速度的影响;针对通信中断的情况,提出了一种基于群势博弈设计的武器-目标分配问题求解方法,仿真对比说明群势博弈设计方法能够以较快速度收敛到次优分配;针对切换通信结构,提出了一种基于状态博弈两步较优响应学习规则的求解方法,实现了最优分配求解,仿真验证了该方法的有效性。
首先,研究了调和博弈的动态等价性及有限博弈的正交分解。通过推导得到了与基底纯调和博弈动态等价的纯调和博弈的充要条件;针对有限博弈的向量空间结构,分别从对称博弈、零和博弈以及正规化博弈的角度出发,提出了基于对称博弈、基于零和博弈以及基于正规化博弈的三种有限博弈的正交分解方法,并分别推导出了不同博弈子空间的基底;比较分析了向量内积在不同博弈正交分解中的作用,证明了只有当相容性条件满足时,不同的正交分解均可在标准内积下实现。
其次,研究了三种不同类型势博弈的检验与设计问题。针对网络上的分布式博弈问题,提出了基于局部信息的势博弈设计方法,给出了设计只依赖于局部信息收益函数的充要条件;针对网络上具有竞争性质的势博弈,推导得到了检验与设计零和势博弈的充要条件;针对网络上的群体博弈问题,推导得到了检验群势博弈的充要条件,提出了设计群体收益函数的方法。
然后,研究了状态演化博弈学习规则的设计问题。提出了基于两步记忆的非耦合较优响应学习规则,证明了该学习规则在可达条件下能够几乎必然地收敛到状态演化博弈的常返状态平衡;证明了不存在能够收敛到一般状态演化博弈常返状态平衡的多项式时间算法;借助于设计的学习规则,实现了有限博弈纯纳什均衡的求解和时变拓扑下多智能体的一致性。
接着,研究了两类超图演化势博弈的检验与动态特性。针对超图群势博弈,推导了超图上的基本网络博弈为群势博弈的充分条件;证明了在群级联短视最优更新规则下,超图演化群势博弈能够收敛到其纳什均衡。针对策略区分博弈,设计了策略区分逻辑响应学习规则,证明了它的收敛性;证明了当基本网络博弈为二人对称协调博弈时,网络演化策略区分势博弈在策略区分逻辑响应学习规则下,其随机稳定状态是由个体风险占优策略组成的局势。
最后,研究了武器-目标分配问题的博弈方法。建立了武器-目标分配问题的博弈模型;针对网络图联通的通信结构,提出了基于局部信息势博弈的武器-目标分配方法,并通过仿真对比了短视最优响应与逻辑响应两种规则对收敛速度的影响;针对通信中断的情况,提出了一种基于群势博弈设计的武器-目标分配问题求解方法,仿真对比说明群势博弈设计方法能够以较快速度收敛到次优分配;针对切换通信结构,提出了一种基于状态博弈两步较优响应学习规则的求解方法,实现了最优分配求解,仿真验证了该方法的有效性。