基于深度Q学习的工业机械臂路径规划方法

来源 :化工自动化及仪表 | 被引量 : 0次 | 上传用户:dexter001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将机械臂避障路径规划问题置于强化学习的框架当中,采用深度Q学习的方法训练策略以规划路径,使得机械臂能够在空间中存在障碍物的情况下实现避障抓捕。生成的策略以神经网络的形式表示,通过经验回放和目标网络的方法解决以神经网络拟合Q函数时网络难以收敛的问题。最后在Mu Jo Co仿真环境上验证了该方法的有效性。
其他文献
本文通过主回路、硬件电路、软件控制算法和水冷散热几个方面对船用低压有源前端推进变频器进行了较为详细的理论介绍,针对船用设备对体积、重量和散热等方面的特殊要求进行了
旅游影响测评是衡量武当山世界遗产地旅游业发展水平的有效手段。基于居民和游客感知的视角,构建评估指标体系,运用模糊综合评价对武当山世界遗产地旅游影响进行测评发现:武当
新型冠状病毒肺炎疫情的发生、发展既是中国之个性危机又体现为人类命运共同体视域下的共性危机,本文从人与自然生命的视角,基于自然生命和谐之意蕴,解析自然生命和谐之实现
在卫生法学的教学中将案例引入课堂教学,能使学生主动参与课堂教学,增强学生对卫生法律知识的理解和掌握,提高学生在实践中运用所学知识解决实际问题的能力。阐述案例教学法
以冶炼烟灰为原料选择性浸出锌,考察了液固比、pH值、浸出温度和浸出时间对锌和砷浸出率的影响。试验结果表明:在液固比2:1、浸出pH值4.0、浸出时间90min、浸出温度25℃条件下,锌
虽然二极管是大家很熟悉的器件,但较全面、较完整的介绍二极管的文章不多,本文给出比较系统、比较全面的有关二极管的知识,以供选择使用参考.
"古币法"是一种关联性研究方法,即利用两个或多个关联的不完全事实互相印证推演出全部事实。运用该法对班墨难题展开合并研究属方法创新。经过论证班墨难题适合作"古币法"第
语文本是个情感化、艺术化的学科,但就目前语文教学的现状来看,语文逐渐被固定化,模式化。在语文的教学过程中,教师总是照本宣科,依据固有的课本框架和多年来形成的讲课习惯,
当今,市场经济变化有进一步深化的趋势,越来越多的产品将走向国际市场,市场竞争将越来越激烈,这一形势的发展要求企业更加积极主动地开展标准化工作,建立健全企业标准体系,利
广州超级计算中心装备着世界领先的超级计算机系统“天河二号”,如何用好该系统将成为超级计算中心发展的难点和关键.围绕广州超级计算中心建设目标,分析了广州主要产业的特