无模型自适应动态规划及其在多智能体协同控制中的应用

来源 :北京科技大学 | 被引量 : 8次 | 上传用户:kkaJov2Qc88R
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能控制系统通过模拟人类获取知识的学习过程,可以有效弥补传统控制理论的不足,并且为克服复杂工业过程的技术难题提供新思路。自适应动态规划方法融合了神经网络、强化学习、自适应评价设计等思想,在应用于求解复杂系统的最优控制问题时可以避免动态规划算法中“维数灾难”问题。本文在自适应动态规划理论的基础研究上,对学习算法的收敛性和闭环系统的稳定性进行了深入探讨,并将自适应动态规划应用于分布式多智能体协同控制。本文的主要工作如下:(1)借鉴优化问题的迭代寻优算法,将连续时间动态系统的最优控制问题描述为三个子问题,在此基础上提出了基于汉密尔顿泛函的理论框架。该理论框架从几何角度给出了最优控制问题迭代求解算法收敛的充要条件。最后利用李雅普诺夫理论证明了在该理论框架下闭环系统的稳定性。(2)针对离散时间动态系统的鲁棒控制问题,首先将该问题转化为辅助标称系统的最优控制问题,并从理论上给出了这种问题转化等价性的充分条件。然后仅利用系统在线运行数据,提出了一种基于数据的无模型自适应动态规划算法,解决了最优控制问题的求解依赖系统模型这一约束。同时也给出了无模型自适应动态规划算法收敛性和闭环系统稳定性证明。(3)针对领航者带有未知控制输入的异构多智能体系统输出同步控制问题,提出了无模型自适应动态规划,解决了目前已有方法对系统模型的依赖,设计了分布式输出同步控制律。此外,已有的多智能体输出同步控制律设计仅考虑了输出同步误差的渐近稳定性,本文提出的无模型自适应动态规划方法考虑了输出同步误差的暂态性能,因而保证了该分布式输出同步控制律的最优性。(4)针对具有多个领航者的异构多智能体系统的包含控制问题,利用无模型自适应动态规划,设计了完全分布式的最优包含控制律。目前已有的分布式控制律设计大多依赖于多智能体系统的全局拉普拉斯矩阵特征值信息,而本文提出的分布式最优包含控制律设计解决了这一问题,从而实现了真正意义上的完全分布式。最终给出了该算法的收敛性和稳定性分析。
其他文献
本文阐述了公共建筑照明灯具节能现状,从照明灯具作用和节能途径展开论述,重点分析照明灯具节能设计与改造投资经济评价分析,确定给用电量大和用电时间长的公共建筑照明用户
前些时日观看了《造梦者》后,被其中的呼斯楞演唱的《鸿雁》深深触动。这样一首看似简单的歌曲却被呼斯楞唱出了不一般的感觉,除歌者本身高超的唱功外,其背后的文化也有着深
语言表达受人们认识客观世界的方法和规律的制约。在普通话的教学、测试中,我们注意到香港人的普通话具有一些语言个性。本文选择量词"间"、动词"说话"和副词"也"这三个出现
《三国演义》中的周瑜是一位个性鲜明,悲剧色彩浓厚的英雄。无论他不屈不挠的斗争精神,还是作为一个英雄人物的最终毁灭所带来的惋惜和悲痛,都体现着周瑜的悲剧性。深入周瑜
通过分析中德被动式低能耗建筑示范项目的关键技术和材料的应用,说明被动式低能耗建筑与我国常规节能建筑在细部构造、关键产品应用、热桥和建筑气密性处理等方面的差异。
根据着色Petri网理论,利用着色token代表不同的资源,并通过分级建模的方法,建立钢结构施工过程的仿真模型;以实验数据为依据确定模型中的随机变量,通过仿真运算得到施工工期
21世纪是海洋世纪,海洋是新时代世界各国发展的资源动力和经济战场。在经济社会发展的新常态背景下,海洋经济已成为拉动我国经济发展的新的增长点。金融业的支持在海洋经济开
德彪西是一位极富个性的艺术歌曲作曲家,其一生运用法文诗歌创作一百多首法文艺术歌曲。这些生动的艺术瑰宝件件均散发出令人着迷的光彩,并且在其艺术歌曲中已经能够清晰的领
目的:探讨来曲唑(LE)微刺激超排卵对卵泡液中胰岛素样生长因子I(IGF-I)和胰岛素样生长因子结合蛋白1(IGFBP-1)水平的影响。方法:96例体外受精-胚胎移植(IVF-ET)患者分为两组,