基于强化学习的小型仿人机器人步行控制技术研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户：qlj403740087

【摘要】

：

仿人双足机器人具有与人类相似的外形,运动方式也更像人,对人类的生活场景具有更强的适应性,在现代社会中应用前景广阔。仿人机器人的控制系统是涉及自动化技术、传感器技术

【作者】

：

高萌

【出处】

：

北京理工大学

【发表日期】

：

2017年01期

【关键词】

：

小型仿人机器人步行控制非平整地面 DQN算法强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

仿人双足机器人具有与人类相似的外形,运动方式也更像人,对人类的生活场景具有更强的适应性,在现代社会中应用前景广阔。仿人机器人的控制系统是涉及自动化技术、传感器技术、电子电工技术、智能控制技术的一种非线性、强耦合的复杂系统。仿人机器人的运动性能和功能特点在很大程度上反映了机器人的先进水平,而其稳定行走的能力则是仿人机器人能为人类服务的必要前提,因此对于仿人双足机器人稳定行走的研究一直是机器人领域研究的重点方向之一。本文以实现小型仿人机器人在非平整地面上的稳定行走为研究目标,围绕仿人机器人在非平整地面上行走时的步行控制技术进行相关研究。为了解决传统动力学方法在解决此类问题时建模复杂、解析困难的问题,本文提出了基于强化学习算法的小型仿人机器人步行控制策略,并就此开展了系统深入的专门研究。首先,本文对19自由度小型仿人双足机器人的机械结构、性能指标、控制要求等内容进行了详尽分析,建立了仿人机器人硬件系统和软件系统的基本框架。其次,通过对硬件系统的核心控制器、运动控制器和传感器三部分元器件的器型选择和电路设计,完成了控制系统硬件部分的设计;经过认真分析与仔细思考,控制系统的软件部分以ROS系统为基础,通过节点(node)建立了主控系统、运动控制系统、传感器系统和通讯系统之间信息传递的桥梁,保证了相关信息与指令的顺利传递。再次,通过对仿人机器人的机械结构和自由度的设计、分析与讨论,建立了D-H坐标系,并对仿人机器人进行了正运动学和逆运动学分析,得出了足端轨迹和机器人质心与腿部各关节角度之间的关系。本文探讨的仿人机器人其运动速度低且加速度很小,属于准静态运动,依据这一前提,本文对仿人机器人进行了基于复合摆线的质心轨迹规划和基于贝塞尔曲线的足端轨迹规划。然后,本文对强化学习和相关算法进行了深入的理论分析,对Q-learning算法和DQN(Deep Q Network)算法进行了详细的算法理论、参数更新和决策的分析。通过对比二者的特点,选择了DQN算法作为步行控制器的核心算法,并对基于DQN算法的步行控制器的状态值、动作值、奖惩函数和网络结构进行了分析和设计,对步行控制器的学习和更新过程进行了分析。最后,为了对基于强化学习算法DQN设计的步行控制器进行实验验证,本文设计了仿真实验和实物实验,通过对不平整地面实验环境的构建,以及实验步骤的设计,得出了实验结果,并对实验结果进行了详细的讨论。研究进展和实验结果表明,本文设计的小型仿人机器人控制系统的硬件电路和软件系统均满足实验要求,达到了预期的控制效果。同时,基于DQN算法的步行控制器能够有效提高仿人机器人在非平整地面行走的稳定性,通过不断的学习和训练能够得出仿人机器人的姿态信息和质心调整的关系。本文的研究成果为仿人机器人步行控制技术的研究提供了借鉴和参考,也为复杂动力学模型问题的解决提供了新的思路和方法。

其他文献

基于RhoA/ROCK通路探讨逐瘀壮骨汤干预激素性股骨头坏死的实验研究

研究一逐瘀壮骨汤对大鼠激素性股骨头坏死的干预作用目的:实验通过建立大鼠激素性股骨头坏死动物模型,并对大鼠进行逐瘀壮骨汤药物灌服后,观察大鼠血液中骨钙素、甘油三酯含

学位

逐瘀壮骨汤激素股骨头坏死大鼠成骨含药血清骨髓间充质干细胞RhoA/ROCK

功率回收型液压泵（马达）可靠性试验台设计与研究

液压泵(马达)作为应用于工程机械主机上的核心液压零部件,其可靠性直接决定重大装备的使用性能和寿命。液压泵(马达)可靠性试验具有试验周期长、能耗大的特点,传统的可靠性测

学位

液压泵(马达)可靠性试验台功率回收

基于可见光定位与惯性导航的室内组合定位系统技术研究

随着智能设备技术的快速发展,人们对于基于位置的服务需求日益增加。由于GPS等传统定位技术无法满足室内精细定位的需求,近年来,以蓝牙、Wi-Fi、可见光定位技术为代表的室内

学位

室内定位可见光定位惯性导航组合定位卡尔曼滤波粒子滤波

精准扶贫背景下我国农业产业化扶贫研究

十八大以来,根据我国扶贫开发面临的新形势和新要求,党中央提出精准扶贫,为新时期的扶贫开发工作指明了方向。在深化推进精准扶贫的新形势下,国内外研究表明,以农业产业化为

学位

精准扶贫农业产业化扶贫产业耦合有为政府

A房地产公司亦庄项目成本控制研究

随着我国房地产市场形势的不断变化以及政府调控政策的颁布和城市化进程的加快,房地产业已经很难再像前几年那样从住宅项目中获得高利润,以致许多开发商开始将目光投向了商业

学位

房地产项目成本控制挣值法动态成本控制

多芳基吡咯衍生物的合成及性能研究

荧光材料由于在电学,光学,生物科学等领域存在着广泛的应用,从而使得越来越多的科研工作者致力于荧光材料的合成及性能研究。传统的荧光材料由于具有共轭刚性平面结构,在聚集

学位

多芳基吡咯衍生物荧光量子产率溶剂效应多聚集形态发光手性

基于社交信息的序列化推荐算法的设计与实现

本文提出了大数据时代下基于深度学习技术的推荐算法,且有机地融合了用户的社交属性,将其融入到序列化推荐模型中。首先本文依据真实数据集Yelp进行预分析,从中发现了用户购

学位

推荐社交网络用户兴趣挖掘深度学习循环神经网络自编码器

集值数据与区间值数据的若干统计模型

集值或区间值数据在现实生活中是比较常见的.例如在医学影像学检查中,得到的病灶图像通常是平面图形,这可以看成R2中的闭集合.又如在股票和期货市场中,作为用于决策的重要工

学位

集值随机变量区间值线性回归模型区间值时间序列模型区间值多元时间序列模型参数估计

K公司画板车间设施布局优化及生产物流系统仿真研究

随着经济全球化和市场贸易全球化的不断深化,激烈的市场竞争促使制造型企业必须通过提高生产效率和降低生产成本等方面不断进行改善。而优化生产物流系统设施布局是提升制造

学位

车间布局优化系统布置设计遗传算法Flexsim系统建模仿真

防火墙规则集动态优化研究

随着科技的进步,网络与人们的生活、工作结合日益紧密,随之而来的网络安全问题也日渐严重。防火墙作为影响网络安全的重要基础设备,在网络安全体系中发挥着不可替代的作用。

学位

网络安全防火墙规则集动态优化自适应能力

基于强化学习的小型仿人机器人步行控制技术研究

与本文相关的学术论文