基于事件驱动的多智能体强化学习研究

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:nsldp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对多智能体强化学习中存在的通信和计算资源消耗大等问题,提出了一种基于事件驱动的多智能体强化学习算法,侧重于事件驱动在多智能体学习策略层方面的研究.在智能体与环境的交互过程中,算法基于事件驱动的思想,根据智能体观测信息的变化率设计触发函数,使学习过程中的通信和学习时机无需实时或按周期地进行,故在相同时间内可以降低数据传输和计算次数.另外,分析了该算法的计算资源消耗,以及对算法收敛性进行了论证.最后,仿真实验说明了该算法可以在学习过程中减少一定的通信次数和策略遍历次数,进而缓解了通信和计算资源消耗.
其他文献
目的:对护理干预对老年痴呆患者吞咽障碍的作用进行探讨.方法:纳入2018年3月~2019年3月在我院进行治疗的120例老年痴呆患者为研究对象,根据入院顺序先后分为对照组和研究组,
目的 探讨联合应用氯吡格雷与硝酸异山梨酯治疗急性心绞痛的疗效.方法 从我院2016年9月~2017年9月收治的急性心绞痛患者中选取77例作为本次研究对象,并随机分为对照组与联合
分析总结了衡阳市茶叶产业发展拥有的优势及存在的主要问题,提出了衡阳市茶叶产业发展思路及对策。
根据工程特点采用多种措施,达到满足工程工期要求、保证工程质量的目的。
结合工程实例,介绍了目前防渗墙的几种检测手段,并对检测方法、检测依据进行闸述。着重提出了一套比较科学、合理、系统并易操作的检测方法,可供今后的类似工程项目参考使用。