基于增量式RBF网络的Q学习算法

来源 :机器人 | 被引量 : 0次 | 上传用户:bianyuantuifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升机器人的行为智能水平,提出一种基于增量式径向基函数网络(IRBFN)的Q学习(IRBFN-QL)算法.其核心是通过结构的自适应增长与参数的在线学习,实现对Q值函数的学习与存储,从而使机器人可以在未知环境中自主增量式地学习行为策略.首先,采用近似线性独立(ALD)准则在线增加网络节点,使机器人的记忆容量伴随状态空间的拓展自适应增长.同时,节点的增加意味着网络拓扑内部连接的改变.采用核递归最小二乘(KRLS)算法更新网络拓扑连接关系及参数,使机器人不断扩展与优化自身的行为策略.此外,为避免过拟合问题,将L2正则项融合到KRLS算法中,得到L2约束下的核递归最小二乘算法(L2KRLS).实验结果表明,IRBFN-QL算法能够实现机器人与未知环境的自主交互,并逐步提高移动机器人在走廊环境中的导航行为能力.
其他文献
论述了纳米光子学的最新进展,介绍了国际上的一些研究小组所做的关于纳米光子学的实验,包括纳米开关、近场光学探针技术、近场光化学气相沉积制备、基于等离子体激元波导实现
双十一,曾经定位仅次淘宝的第二大电商拍拍网宣布了即将关张的消息。据其母公司京东的公告称,原因是C2C模式无法杜绝假货现象,所以决定彻底关闭。
现有种类化学农药毒性大、危险性高、残留难以清除,会产生巨大污染,难以满足饮食安全和环境保护方面的需求。农业害虫对杀虫剂抗性的持续增加,导致农药的作用效果减弱,严重威
智能建筑是利用系统集成方法将智能型电脑技术、通信技术、信息技术与建筑技术有机地结合起来,可以对各种设备的自动监控信息进行分析、正确判断和处理。本文论述了智能建筑
目的:探索研究护理延伸服务在脑卒中家庭护理中的应用和效果分析。方法:将我院在2013年1月到2013年3月之间收治的5例患者在进行传统的健康宣教的基础之上进行护理延伸服务,作
由中国汽车工程学会、中国汽车技术研究中心主办的"2015汽车NVH控制技术国际研讨会",于2015年6月4日-5日在合肥市成功召开。会议吸引了来自墨尔本皇家理工学院、Johnsoncontrol
目的探讨右美托咪定对腹腔镜下胃癌手术七氟醚用量及血清炎症因子水平的影响。方法将104例早中期胃癌患者随机分为观察组与对照组,各52例。对照组采用常规静吸复合麻醉,观察
财政部等五部委分别于2008年与2010年颁发了《企业内部控制基本规范》及配套指引,要求沪深两市的上市公司于2012年开始施行,这标志着适合我国企业实际、融合国际先进经验的中
目的将个性化护理应用于完全胸腔镜下肺叶切除术后患者的效果分析。方法随机筛选于2016年1月至2017年12月入院接受完全胸腔镜下肺叶切除术的26例患者,均分为分析组与参照组,
企业在进行国际贸易时,常常会面临来自外国政府的各种政治风险,如资本不能转移风险,没收风险、战争风险等等,这些政治风险都会给企业造成一定的损失。政治风险保险就是这些企业提