学习人类策略在机械臂的应用研究

来源 :中国科学院大学 | 被引量 : 4次 | 上传用户:hamjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本课题面向日益增长的服务机器人研发需求,尤其是服务机器人中的所需的机械臂,利用学习人类控制策略进行智能控制技术的研究。本文首先介绍机械臂的基础运动学控制,并提出一种机器人模仿系统。通过正向运动学,机械臂能够从关节角计算出末端位置,通过反向运动学,又能够计算出合适的关节角以期到达设定的末端位置。通过捕捉系统,如Kinect,在得到人体运动信息的基础上,模仿系统将人运动映射到机器人的关节角,从而使得机器人能够实时模仿人运动。机器人模仿系统只是尽量精确地复制人的运动,学习人类控制策略引入学习的方法提取运动策略。其一般划分为三阶段:示例阶段,学习阶段和复制阶段。在示例阶段,人类导师主动地控制机器人完成一些运动,并将运动中机器人的状态变量存储起来。学习阶段通过机器学习的方法,从示例中学习一个控制模型,该模型需要具有泛化能力。当机器人遇到不同的场景时,复制阶段利用学习到的模型得到一个具有相似特征的轨迹。同时我们还需要考虑鲁棒性问题,即学习到的轨迹具有稳定性,总是能够到达特定的目标点。本文的算法是基于极限学习机,通过将机械臂点到点的运动建模为自治动态系统,即不显含时间变量的动态方程,并利用该方法进行学习。在给定初始点和目标点的基础上,算法利用数值积分完成复制阶段的轨迹生成。我们通过李雅普诺夫控制理论推导出能够使该系统具有全局和局部渐进稳定的约束条件,并将这些条件加入到基于优化的学习中去。该系统结构简单,易于实现,且能取得很好的泛化性和鲁棒性。我们实现该系统,并在数据集上进行模拟和在Nao机器人上进行实验。模拟和实验结果能充分验证学习到的系统的稳定性,而且对于时间扰动和空间扰动,该系统都能有很好的鲁棒性。
其他文献
学位
通信控制器是现场总线通信控制单元中的重要组成部分,用于实现现场总线低层协议。目前,出于减轻主CPU 负担的考虑,低层通信协议大多由专用硬件实现,这就使得通信控制器的成本
随着科学技术的发展,实时图像处理技术在实际应用中越来越广泛,研究切实有效的图像处理算法,优化算法结构,采用数字集成电路和具有高速运算能力的处理器进行高速实时处理,有机结合
本文在分析主动磁悬浮轴承系统工作原理的基础上,建立了主动磁悬浮轴承系统单自由度传递函数模型和五自由度状态方程模型.以TI公司的数字信号处理器(DSP)TMS320LF2407为核心
工业机器人经过几十年来的长足发展,在控制精度上已经达到了很高的要求。但在工厂中广泛使用的工业机器人还是需要人类操作员来进行耗时的示教工作。工业机器人大多缺乏对环境
光机组件是大型激光驱动器的重要组成部分。目前,我国的大型激光驱动器装置虽已处于世界领先行列,但在装置建设中,尤其是光机组件的装配过程中,主要以人工为主,自动化程度低下。因
针对国内外污水处理行业的发展现状,本文对污水处理厂自控系统的历史和发展情况进行了全面、系统的阐述;结合污水处理工艺特点及其对自控系统的具体要求,设计了污水处理厂计算机
随着我国大型装备制造和战略科学研究的需要,大口径光学元件在各种大型光学系统中应用越来越广泛,例如大型天文望远镜镜片、惯性约束核聚变系统中激光驱动器、资源卫星大视场角
本文系统的研究了含间隙铰的多体动力学问题。运动副中的间隙会导致物体之间的冲击力,并产生磨损和噪声,降低系统的效率和工作精度。精细研究含间隙作用的机械系统的动力学模型
在网络信息时代,信息已成为社会稳定和发展的重要战略资源,如何保证信息的安全逐渐成为人们关注的焦点。密码技术作为解决安全问题的有效手段,在各种安全解决方案中得到了广泛的