势博弈理论的分布式优化与控制

来源 :南京工业大学 | 被引量 : 0次 | 上传用户:chengshisanren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
优化与控制一直是跨学科研究的一个基本问题。而这个问题的传统方法是集中式的。由于在许多现实世界的应用中可扩展性,可靠性和有效性,对于优化与控制最近的研究集中在分布式解决方案。在分布式系统中资源优化与控制问题的主要目标是为了每个代理设计局部控制规则以确保相对于一个给定的系统级目标而言全局行为是可取的,在许多系统中通过耦合约束代理的行为使得优化与控制设计更加复杂,本文使用博弈论来解决这类问题。博弈论优化与控制是一个很有前途的分布式资源分配的新方法,在博弈论优化与控制下的分布式资源分配中每个代理有着共同的利益目标----最大化全局目标函数。如果博弈被设计为一个势博弈那么学习动力就拥有固有的鲁棒性,并且学习动力作为一类广泛的分布式学习算法在多种信息的依赖下可以收敛到一个纯粹的纳什均衡。  本研究主要内容包括:⑴描述了博弈优化和控制如何可以被看作是具有一种内在的分层体系,并使用一种简化控制设计的模块化框架。这种框架以势博弈为接口,包含了效用函数设计和学习动力设计。本文研究的分布式问题的解决方案由此框架展开。⑵给出一个博弈论优化方法分布式的求解数独问题,首先为其建立效用函数并证明数独问题可以转化为势博弈模型,然后使用学习动力逐步优化参与者的状态以达到势博弈的最优状态即纳什均衡点。势博弈现有大部分研究结果限于计算机仿真,没有实现真实的物理博弈,为此给出数独问题一个物理的博弈实现。⑶介绍了基于势博弈合作控制的动态环境,将通过两个例子问题进行说明。第一个是移动目标追踪问题,采用的学习动力将考虑两个方面:一个是依据该问题当前策略集与前一个策略相关性,另一个是通过利用策略的惯性来减少每个参与者的计算量。第二个是机器人路线选择问题,该问题中多个机器人面临随机生成的动态目标环境,各自选择自己的路线以适应动态变化的环境。计算机仿真表明势博弈的动态优化是可行和有效的。
其他文献
在该文中,我们使用XML和Web服务技术来建立基于XML的电子数据交换框架.该文首先对Web服务的概念及其信息架构做了一个探讨,并分Web服务消息协议、Web服务描述语言、Web服务发
学位
该文围绕作者设计和实现的SCGIS的矢量图形子系统对相关内容进行了介绍.文章首先介绍了GIS的基本知识,其中包括GIS的概念组成、发展现状、应用及研究热点等内容.然后介绍了SC
学位
该课题的重点是规划了保证专利电子申请与流程审批管理系统(EASY_CPMSⅢ)安全的网络结构,提出EASY_CPMSⅢ中可能出现的网络安全问题的解决方案,针对该系统的特点提出为了保证
学位
该文从统计学习理论与支持向量机研究中遇到的若干问题出发,着重研究了如何通过增加学习模型的适应性来提高学习模型泛化性能.该文利用2种方法来提高学习模型的适应性:一是将
该文重点对EPICENTRE数据仓库/OLAP系统的体系结构、数据建模技术、物理存储技术及多维分析技术进行研究,解决基于Epicentre对象模型的数据分析处理问题.首先,在分析领域需求
计算机支持协同工作(CSCW)是人类社会入进信息时代的必然产物,是未来人们协作的主要方式.随着CSCW系统的不断发展和应用的不断增加,很多专用的CSCW系统相继产生.鉴于众多CSCW系
该文属于地学信息计算机处理的研究范畴.涉及到计算地球物理、图像处理、小波变换、编码理论、数据压缩等方面的知识.该文共分八章,分为两部分对地球物理数据处理展开研究工