基于增强学习的多机协同路径规划的研究与应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:poiuytrewq10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人技术的发展使机器人的能力不断提高,机器人应用领域和范围不断扩大。路径规划作为移动机器人技术的一个重要组成部分,对它的研究具有重要的理论意义和工程应用意义,而多机器人协同工作下的路径规划更是一个研究热点。 增强学习是近几十年来迅速发展起来的一类机器学习方法。增强学习不需要有先验知识,而是通过与环境的不断交互获得知识,改进行为策略,具有自学习能力。增强学习由于自身的特点,在自主机器人研究领域中受到了国内外越来越多的重视。本文将致力于基于增强学习算法的多移动机器人协同路径规划的研究。 基于马尔可夫过程的增强学习能够很好地应用于单智能体环境中,而由于增强学习的特点,在多智能体系统中马尔可夫过程模型不再适用,因此不能把增强学习直接用于多智能体的协作学习问题。 为此本文首先提出了基于增强学习的分布式控制的多智能体协作方法。该方法主要通过在每个智能体中构筑两层增强学习单元来实现,第一层增强学习单元负责学习智能体的联合任务协作策略,第二层学习单元负责学习智能体内最有效的行为策略。 另外,本文还提出了基于智能体运动特征的增强学习奖赏函数。 在静态、动态环境下的多智能体协同搬运实验表明本文提出的方法能有效地完成搬运任务。此外,在动态环境下的多智能体协同搬运实验表明基于智能体运动特征的奖赏函数使智能体更早发现较优路径并很好地完成了协作任务。
其他文献
本文通过对荣华二采区10
初中生英语口语教学是一项难度较大的教学工作,对于缺乏相应语境的中学生来说,英语口语表达始终是他们急需提升的能力之一。然而,从目前初中英语教学的现状来看,部分教师仍然痴迷
本论文根据现有的实验条件,对于低噪声HEMT,低噪声放大器的设计进行了研究,提出了适合我们设计要求的HEMT件外延层材料结构。  根据低噪声放大器的设计要求,对于低噪声放大
植物光合产物分配直接影响到陆地生态系统的生产力。准确模拟植物光合产物分配动态及其对环境变化的响应将直接影响陆地生态系统生产力和碳收支的准确评估。本文首先探讨了土
集成电路中的所有器件都是通过电源网格得到其所需的供电电压的。随着集成电路制造工艺的不断向前推进,尺寸的不断缩小,电源网格完整性分析也变得越来越重要了,互连线的电阻
开放式基金费用与绩效和资金流之间存在密切的关系,本文选取2006~2007年的数据,以开放式股票型基金为研究对象,采用面板方法进行实证分析,结果表明基金费用与绩效之间呈现明显
小学语文教学的目的,是指导学生正确理解和运用祖国的语言文字,使学生具有初步的听、说、读、写的能力。须知,语文课的第一任务是让学生学习语言。而读是学习语言的重要途径之一
随着Internet的飞速发展,它成为了迄今为止最密集、最丰富的信息来源。那么从这些海量数据中找到使用者感兴趣的信息逐渐成为人们关注的焦点。作为从 Web 文档和 Web 活动中
随着芯片集成度的快速增长,集成电路工业进入到了片上系统(SystemonaChip,SoC)时代。急剧上升的复杂度和日益苛刻的上市时间向传统设计方法提出挑战,迫切需要更有效,更快速的新的
创业板,这个世界上鲜有成功的板块,历时十多年反复商讨终于登陆中国市场。自1998年证监会主席周正庆提出要在证交所建立科技板块以来,国内财经界对创业板的争议就没停止过,有