融合KCCA推断强化学习的机器人智能轨迹规划

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xukaiboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI~2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI~2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI~2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度.
其他文献
随着信息化建设的快速发展,数据产生了爆炸式的增长,医院每天也同样产生成数以百计的医疗记录与数据。其中大部分内容是非结构化数据,具有真实性、主观性和不规范性,不利于解
阐述了基于Android平台的移动智能点餐系统中排队模块的仿真与算法的优化,采用ExtendSim仿真软件以及大量案例,对仿真理论方法的实际应用以及相应算法进行了介绍,是系统技术层面
患者 ,男 ,5 8岁。登二楼气喘、憋 ,伴心慌加重 2年 ,近 1月受凉咳嗽 ,吐黄粘痰。诊断 :慢性支气管炎 ,慢性阻塞性肺气肿 (重度 ) ,慢性肺源性心脏病 (心功能代偿期 ) ,收入
当归黄芪对实体瘤鼠SOD活性的影响武汉市职工医院学院(430016)高观月,朱秀华近年研究发现,中草药在抗肿瘤或作为化疗药物的增效减毒剂方面有巨大潜力。而活性氧自由基与癌症的发生关系密切
期刊
随着数学新课程改革的深入开展,对课程理念的价值取向、课程内容的生活化与形式化、课程实施的探究性与接受性、课程传统的借鉴、继承与发展等问题的自觉反思,有利于课程改革寻
针对目前晶闸管中频感应电源存在的问题.提出了一种新的主电路和控制电路设计方案。该方案采用了频率自动跟踪和PWM-IGBT控制技术,运用了功率因数调节、零压扫频软启动、双闭环
越来越多的证据表明,坐班工作也会降低生产力。 为整公司颓势,雅虎总裁玛丽莎·梅耶尔做了诸多努力,其中包括,要求雅虎所有员工从六月起都必须到办公室办公,并通过雅虎人力资
从密集烤房的具体形式、能源利用、装烟方式和烘烤工艺等方面综述了近几年我国密集烤房相关研究的成果及应用现状,在此基础上,探讨了我国烤烟密集烘烤今后的发展方向。为了使密
随着我国工业现代化、自动化技术的不断发展,传统的监控技术只能实现对于设备的基本监控,已经不能满足我国工厂目前对于设备监控的需求。为了更好地适应我国工厂目前对于设备
<正>幸福感研究中需要回答的首要理论问题便是“幸福感是什么”,另一个重要问题是“幸福感从哪里来”,也就是要探讨幸福感的本质和影响因素两大问题.早期研究者发现,从幸福感
会议