基于事件触发自适应动态规划的多智能体一致性研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:wocaonima3344521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,协同控制被广泛应用于工程实践领域,其中的多智能体最优一致性控制成为了当下重要研究课题。设计最优一致性控制协议并使得多个智能体在该协议下状态趋于一致是研究的关键。由于多个智能体所构成的分布式系统中通信网络结构复杂度的加深,现有理论研究中主要存在以下两点不足。第一,传统的动态规划方法在求解优化方程时会出现维数灾问题,哈密顿-雅可比-贝尔曼方程的解析解也难以求出;第二,在现有的多智能体系统一致性研究中,对于信号的采样和更新均是以时间驱动下的周期采样方式进行的,造成了网络资源利用率下降。为了弥补以上两方面的不足,本文针对几种不同的多智能体系统,将事件触发机制、动态规划与强化学习相结合,设计了事件触发自适应动态规划方法来对其最优一致性控制进行研究。本文主要研究内容如下:(1)针对含输入约束的多智能体系统,设计了事件触发动作依赖启发式动态规划方法,研究了该系统的最优一致性控制问题。本方法为了克服饱和非线性的影响,在设计系统的控制器时引入了非二次型函数。通过动作依赖启发式动态规划结构中的执行网络和评价网络对最优控制策略进行学习,提出的事件触发条件确定了神经网络的权重更新时刻。仿真结果表明在所提方法下系统稳定,并且多智能体的状态趋于一致,同时也节约了通信网络资源。(2)针对含时变输入时滞的多智能体系统,设计了事件触发启发式动态规划方法,研究了该系统的最优一致性控制问题。本方法通过离散化模型将原系统转换为不含时变输入时滞项的系统,并证明了转换前后系统性能指标函数等价。设计了事件触发条件保证启发式动态规划结构中的模型网络、执行网络和评价网络仅在事件被触发时更新。最后仿真结果表明本方法能够保证多智能体的状态具有一致性,并且通过与时间驱动下的方法进行对比可知,本文所设计的方法在节约网络资源的同时还能够确保含时变输入时滞的多智能体系统获得更好的性能。(3)针对含输入扰动的多智能体系统,设计了事件触发单网络自适应动态规划方法,研究了该系统的最优一致性控制问题。本方法在设计控制器时,将耦合增益与系统代价函数的解析解相乘,构造出对抗扰动项的控制策略。再将输入扰动项由一个神经网络模型来替代,与执行网络共同调节、彼此制约,得出的最优控制策略能够在输入扰动最大的前提下使代价函数最小。评价-执行-扰动网络共享评价网络的权值估计法则,其更新时刻由事件触发条件决定,合理避免了网络学习中不必要的计算。仿真证明本方法既能够满足系统的预期结果,又能减少通信过程中信息资源的浪费。
其他文献
铸件生产所涉及到的工序极为复杂,每一道工序的操作技能和管理水平的高低,都将会对铸件的质量产生影响,铸件产生缺陷的原因多种多样,在生产过程中只有理清楚了导致缺陷产生的原因,才能及时采取防止措施,优化铸件质量。本文,尝试对铸件缺陷产生的原因进行分析,探究防止措施,以求更好的优化铸件质量。
文章介绍了二甲醚的主要生产工艺,并对一步法合成二甲醚的等温列管式反应器进行了描述,使用matlab 对等温列管式反应器的二维数学模型进行了求解,最后对一步法合成二甲醚的合成系统进行了 Aspen plus 模拟。
煤矿主提升机属于矿产开采期间常用的运输设备,经机械结构、电器设备构成,可很好的完成井上生产工作任务、井下生产工作任务。矿井提升机电控系统是保障矿井安全生产的重要组成部分。传统的提升机电控系统存在设备老化及自动化程度低等问题,往往不能满足矿井发展需求,并可能带来一定的安全隐患。随着电器自动化技术的发展,多数矿山都应用 PLC 技术对矿山电控系统进行了升级改造,取得了良好的效果。本文对矿井主提升机电控系统功能实行相关概述,然后对主提升机电控系统优化对策进行刍议,以此不断完善煤矿主提升机电控系统,促使系统运行更
无人机市场快速增长,购买量持续上升,无证飞行和未经许可随意飞行的无人机“黑飞”事件屡屡发生,给航空安全、国家安全、人身安全和公共安全都带来了严重隐患。尤其是在广场、公园等民用公共生活区域,如何对“黑飞”无人机进行威胁反制成为了亟待解决的问题。识别无人机是无人机威胁反制技术中的重点、难点问题。针对广场、公园等民用公共生活区域如何有效、高效地识别无人机的问题,本文研究了多维度智能识别方法。首先,运用声
带式输送机实际运行过程中,由于受到各种因素的影响,不可避免地会出现一些故障,影响其正常运行。针对带式输送机的常见故障,应当制定科学、有效的处理措施与防范对策,以实现煤矿的安全、高效生产。文章在对带式输送机进行简述的基础上,探讨了煤矿带式输送机的常见故障及其处理措施,并提出了煤矿带式输送机故障的防范对策,供相关研究、实践借鉴。“,”in the actual operation process of belt conveyor, due to the influence of various factors
应用了超空泡减阻技术的水下高速机器人,其身体的大部分被空泡所包裹,能够大幅度减小航行阻力实现超高速航行。水下高速机器人在水下高速武器领域有很大的应用前景,俄、美、德等海军强国都投入了大量人力物力对其进行研究,我国在此领域的研究还比较落后。舵机作为水下高速机器人的重要执行机构,其控制系统性能的好坏将直接决定水下高速机器人能否稳定航行和其航行品质,于是本文对水下高速机器人的舵机控制系统展开了研究。论文
文章以制备复合涂层为切入点,首先说明了涂层的制备机理,其次阐述了原料选用、实验开展要点,最后以实验结果为依据,系统分析了复合涂料性能,内容涉及干燥时间、硬度等内容,希望能为相关人员提供帮助,使制备复合涂料所用工艺得到快速发展,为行业发展助力。
本文根据矿井通风系统的实际运行情况,准确辨识危险源,在通风系统、运行制度方面强化管理,以期为此后矿井通风系统的建设提供更多借鉴依据。
现阶段来看,火电厂生产运转模式发生了较大变化,锅炉汽机本体与压力管道的工艺应用情况往往会对火电厂的整体运行能效产生较为明显的影响,为了使当前火电厂的经济效益得到有效提高,应该注意从工艺角度入手,对其保温节能措施进行分析。基于此,本文也尝试对锅炉汽机本体以及压力管道的材料选择情况、施工过程等等进行了分析,希望可以以此提升其整体节能保温效果。“,”At present, the production and operation mode of thermal power plants has changed
高岭土和碳酸钙在无机工业均有较为广泛的应用。本文以不同比例高岭土和碳酸钙为反应物,研究该反应体系在不同煅烧温度(900℃ ~1200℃)下,所得晶相组成。反应物中高岭土 / 碳酸钙比例不小于 1 时,900℃和 1000℃反应条件下,碳酸钙掺入量对晶相组成影响较大,随着碳酸钙比例增多,会有氧化钙衍射峰的出现,且石英峰强度逐渐变小,钙长石的峰逐渐增多;1100℃和 1200℃时,莫来石晶相形成,随着碳酸钙掺入量增加,石英峰强度逐渐变小直至消失,莫来石峰也逐渐减少,钙长石衍射峰逐渐增加。当反应物中高岭土 /