基于局部加权k近邻的多机器人系统异步互增强学习

来源 :东南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:shi893932393
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多机器人系统的增强学习问题,为提高机器人的学习速度和充分利用通信范围内其他机器人的增强学习的经验和结果,给出了2类基于局部加权k近邻时间差分的多机器人系统的交互式学习策略.对于机器人之间通信无时滞情形,基于环境感测和任务信息状态描述的局部加权k近邻状态选择方法,机器人通过对自身和通信范围内其他机器人Q值表的比较和分析,对其自身的Q值表进行优化迭代更新.在此基础上,分别给出了基于全局通信条件下和局部通信条件下多机器人系统的异步的互增强学习方案.最后,通过仿真实验进一步验证了所提方案的可行性和有效性.
其他文献
含钛高炉渣的综合利用一直是重要的研究课题.为了使渣中的钛氧化物经还原氮化处理后转变为氮化钛,并使其颗粒长大,以便进行冶金选矿,将含钛高炉渣配加石墨粉并通氮气,在1 360
近年来,大商场越建越多,小商店越办越多,商业竞争日趋激烈。在经历了有奖销售、十点利销售、仓储式销售和情感销售等一系列营销大战后,定位销售成为商界新的选择。定位销售即
期刊
<正> 生物农药的主要原料多为农副产品,用这些原料生产的生物农药不仅能增加农副产品的产量,而且其安全性是传统农药所无法比拟的有专家预言,21世纪的主导农业是绿
为了对钢包的烘烤温度进行在线预测,笔者耦合了流体流动、燃烧和换热过程,建立了多入口、多出口的三维非稳态钢包烘烤数学模型.利用计算流体力学软件CFX4.3,采用有限差分方法
为了改善大尺寸图像下红外小目标检测的检测率与速度,提出一种采用监督特征学习的检测算法.通过分析小目标邻域图像的分布特点,定义一种基于灰度分布的统计特征,用以描述目标
冬牧草是畜、禽、鱼安全越冬的美味佳肴,大型饲养场安全运作,快速出栏,高效产出的金玉良方,产品一上市就备受青睐,引起各地农户、农场、投资种养业者的关注。
小龙虾,学名克氏原螯虾,又称克氏螯虾、红色沼泽螯虾。原产北美洲,1918年由美国引进日本,1929年由日本引进我国,现主要分布于长江中下游地区。近年来,小龙虾在国际、国内市场十分火
<正> “挚着地追求、但不盲目;对认准去追求的东西,要一直保持浓厚的兴趣,不要失去兴趣,默默地不息追求,而不是朝三暮四。成功不是成就,成功是一