基于强化学习的多机器人任务分配算法研究

被引量 : 0次 | 上传用户:wuzx5858
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究得到国家自然科学基金项目(60675057)资助。本文以多机器人系统任务分配策略为研究对象,研究其在复杂动态环境下的机器人间如何协作的问题,即如何通过自身的学习以及与其他机器人的交互来适应环境变化,从而提高系统的整体性能和任务完成的效率。全文主要工作概括如下:建立了多机器人救火任务的数学模型,并且针对该任务改进了市场法的任务分配策略,设计了符合动态任务要求的竞标函数,提高了任务完成效率。应用强化学习实现了多机器人在动态环境下的任务分配,通过奖励值时间衰减的方法使机器人单独学习多机器人协作任务,提高了学习速度。设计了群体机器人集群行为控制算法,该方法能够使群体机器人保持同一方向集群前进。开发了多机器人仿真系统,利用此仿真系统进行了大量实验。最后,对全文进行了总结。
其他文献
<正>2017年3月12日,习近平总书记出席十二届全国人大五次会议解放军代表团全体会议时强调,深入实施军民融合发展战略,加快建立军民融合创新体系,为我军建设提供强大科技支撑
目的 本试验研究抵抗素、脂联素、瘦素与2型糖尿病及其大血管并发症的关系,探讨抵抗素、脂联素、瘦素对2型糖尿病及其大血管并发症形成的作用和机制,为防治2型糖尿病及其大
基于程序主体性理念及儿童利益最大化的要求,家事诉讼中应给予利益相关的未成年人以特别的程序保障。我国家事诉讼中未成年人的程序保障存在制度性缺失,这是因为我国诉讼行为
<正>党的十八大以来,陕西国防科技工业以深化改革,创新发展,建设军工强省和军民融合大省为目标,紧紧围绕高新技术武器装备、重大科技专项研制、军工核心能力建设、军民融合产
本文采用溶胶凝胶法合成了层状锂离子电池正极材料LiCoO2,用含混合价(+2及+3)镍化合物Ni3O2(OH)4纳米粉末为原料合成了作为LiCoO2最佳替代物之一的层状正极材料LiNiO2,另外采用溶胶
<正>党的十八大以来,四川省国防科工办坚持"富国强军"的大情怀,立足"建设中国特色先进国防科技工业体系"的大视野,推动"军民深度融合"的大变革,经过五年建设,实现长足发展,在
探明我国建成区绿地率空间格局及演变规律,对分类制定不同区域建成区绿地率提升政策,实现国家建成区绿地率总体发展目标具有一定指导意义。以大陆31个省级行政单元为样本,采
以C60、C70为代表的富勒烯全碳分子材料,不但具有完美的分子结构对称性,而且具有奇特的物理化学性质。富勒烯研究是目前功能材料开发的前沿领域之一,研究的重要焦点是其薄膜形态
为比较不同干燥方法对个青皮品质的影响,筛选衢州产柑橘幼果的最佳干燥方式,分别采用日光自然晒干、紫外烘晒干燥的方法对柑橘幼果鲜果进行处理,通过分析干燥后所得个青皮的
<正>国防科技工业系统坚决贯彻中央决策部署,以国家战略为先导,忠实履行强军首责,深入实施创新驱动和军民融合发展战略,着力建设中国特色先进国防科技工业体系,各项工作取得