面向多机器人系统的增强学习研究进展综述

来源 :控制与决策 | 被引量 : 0次 | 上传用户:ten_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于增强学习的多机器人系统优化控制是近年来机器人学与分布式人工智能的前沿研究领域.多机器人系统具有分布、异构和高维连续空间等特性,使得面向多机器人系统的增强学习的研究面临着一系列挑战,为此,对其相关理论和算法的研究进展进行了系统综述.首先,阐述了多机器人增强学习的基本理论模型和优化目标;然后,在对已有学习算法进行对比分析的基础上,重点探讨了多机器人增强学习理论与应用研究中的困难和求解思路,给出了若干典型问题和应用实例;最后,对相关研究进行了总结和展望. The optimization control of multi-robot system based on reinforcement learning is a frontier research field of robotics and distributed artificial intelligence in recent years.Multi-robot system has such characteristics as distribution, heterogeneity and high-dimensional continuous space that makes multi-robot system enhanced learning Facing a series of challenges, this paper systematically reviews the progress of its related theories and algorithms.Firstly, the basic theoretical models and optimization objectives of multi-robot enhanced learning are expounded. Then, Based on this, the difficulties and solutions in multi-robot enhancement learning theory and application research are discussed. Some typical problems and application examples are given. Finally, the related research is summarized and prospected.
其他文献
探讨了化学动力学三大发展阶段(宏观反应动力学阶段、元反应动力学阶段和微观反应动力学阶段)中诺贝尔化学奖的13次颁发对其发展的影响.
化学动力学是讨论化学反应炔慢阅题的,是物理化学课程的重要章节。基矛化学动力学的发展现状,给出了化学动力学的各部分内容课时安排。提出化学动力学教学基本要求和教学方法。
赣东北地区分布着大量明清时期留存下来的形态多样、风格各异的传统戏场建筑以及伴随着这些戏场建筑流传至今的传统木作技艺。近年来,传统建筑营造技艺随着非物质文化遗产概
19世纪,科学家更多地从原子层次上认识和研究化学。20世纪科学家则更多地从分子层次上认识和研究化学。进入21世纪,化学会在哪些方面取得重大突破?会遇到哪些挑战和难题?什么
一.奈保尔之争很久以来,南美洲对我就有着一种无法抵御的诱惑力,这主要由于以下三个因素,她与我们的距离最为遥远,她的媚惑人的音乐和舞蹈,她所奉献的作家和作品。在离开伦
传染性非典型肺炎(SARS)是由新型冠状病毒引起的严重急性呼吸道综合征,主要侵犯肺泡气体交换膜和免疫系统,引起一系列严重症状.本文就SARS病原学和发病机制进行综述.
本文对我国东、中和西部三省十一县,以及对四个特殊地貌类型的省区,开展人口密度和社会经济发展相关分析表明:对于社会经济发展处于不同发展水平和不同地貌类型的地区、人口密度
午饭的时间到了,我和妈妈在马路上走着走着,发现一家有趣的面馆,店名叫摔面馆,一个“摔”字把我俩吸引进去了。走进小店,老板热情地招待我们。刚落座,我就听到“啪啪啪啪”的