动作预测在多机器人强化学习协作中的应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多机器人系统中,协作环境探索的强化学习的空间规模是机器人个数的指数函数,学习空间非常庞大造成收敛速度极慢。为了解决这个问题,将基于动作预测的强化学习方法及动作选择策略应用于多机器人协作研究中,通过预测机器人可能执行动作的概率以加快学习算法的收敛速度。实验结果表明,基于动作预测的强化学习方法能够比原始算法更快速地获取多机器人的协作策略。
其他文献
目的分析壮族人群低出生体重发生情况,探讨低出生体重儿的影响因素。方法选取在广西平果县人民医院、妇幼保健院及德保县妇幼保健院2012年1月1日~2015年6月1日出生的4 915例
聚异氰脲酸酯(PIR)泡沫是一种新型的热固性保温材料,它具有密度低、耐热性能及耐寒性能优越、阻燃性能好、尺寸稳定性高等优点,但纯PIR泡沫质脆,无法直接使用.为了改善PIR泡
疫情裹挟之下,不少抗击打能力较差的科技型中小企业,陷入“停摆”状态。时下,尽管各地都拿出了真金白银,针对性地出台了帮扶措施,但情况依然不容乐观。工业和信息化部副部长张克俭
报纸
对毛木耳AuriculariapolytrichaAP4的粗酶液进行PAGE电泳后发现含有三种漆酶同工酶,并且通过运用NativeSDS-PAGE获得三种漆酶的分子量大小分别约为:LacA(110kD);LacB(84kD);L
民航运输业是为旅客、行李、货物或邮件提供空间位移的服务行业。依据我国《消费者权益保护法》(以下简称《消法》)的规定:“消费者为生活消费需要购买、使用商品或者接受服务,其
报纸
<正> 战后,日本农业在以家庭式小规模经营的基础上实现了农业现代化。但是,今天的日本农业仍面临着很多问题,其中之一就是兼业农户的数量不断增加。据日本农、林、水产省《农
随着国民经济的日益发展,石油作为一种经济发展的重要资源和动力,对国家和地区发展发挥着重要作用。石油、天然气和低沸点液体的管道输送过程,在石油工业中是重要的研究课题,
1案例1.1简要案情某男,49岁,某夜22时许在自家葡萄园中遭他人用高压气枪误射头部,次日13时许,当地群众发现其尸体后立即报警。1.2尸体检验死后约13 h行尸体检验。尸表检查:死
语言与世界的关系,是一个永恒的哲学命题。晚明名僧达观读苏轼《法云寺钟铭》,大悟“一切文字语言,皆自心之变也”,并说认识到文字语言这一本质,则为诗为赋,悲鸣欢呼,无可无不可。达
报纸
油墨粘度对印品有影响吗?油墨的粘度对印品影响不少。假设油墨粘度过大,容易引起传墨不匀,胶布堆墨等现象,而纸张表面,也会因油墨的粘度过大,而出现剥纸的问题;另一方面,如果油墨的