基于强化学习的双足仿人机器人步行控制

来源 :吉林大学 | 被引量 : 0次 | 上传用户:TNT2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展与进步,机器人已经开始广泛应用在人们的生产生活中。双足机器人是其中的热点领域,其具有灵活性高、适应性强的特点,可以直接使用一些为人类设计建造的设施,融入人类的工作生活中。在双足机器人的应用中,稳定的步行能力是其顺利完成工作任务的基础。但双足机器人结构复杂,步行控制困难,传统的步态规划控制方法具有模型复杂度高、应用场景局限、生成的步态与人体步态差异较大等缺陷。因此,进行步态规划控制方法的创新研究具有重要意义。针对上述传统步态规划控制方法存在的问题,本文设计了一种基于强化学习框架的步行控制器,在仿真环境中进行智能体步行策略训练,并将步行策略移植到机器人物理样机上进行实验验证。本文主要研究内容包括:(1)根据实验任务不同分别研发了两台机器人实验平台,10自由度机器人样机具有仿人体的质量分布和结构设计,旨在生成与人体步态相似的步行动作;6自由度机器人样机具有简单的结构和较低的制造成本,承担步行策略在物理样机上的验证任务和步态的鲁棒性实验任务。分别对两台机器人进行了结构设计和硬件选型,并搭建了基于RTOS(Real Time Operating System)和ROS(Robot Operating System)的控制系统。(2)分析说明了几种主流的强化学习算法各自的特点,设计了基于近端策略优化(Proximal Policy Optimization,PPO)的步行控制器,进行了奖励函数、噪声条件等部分的设计与搭建。(3)构筑了仿真实验环境并进行仿真步行训练。在Gym强化学习标准化环境的基础上,结合Mu Jo Co仿真平台,智能体由步行控制器驱动与环境交互学习步行策略,并将生成的步行策略的性能在仿真环境中进行验证。(4)搭建真实实验环境,将仿真环境中生成的步行策略移植到机器人物理样机上进行步行实验,并对机器人步态的仿生性和鲁棒性等进行了分析比较,表明强化学习在双足机器人步态规划过程中的有效性。本文针对传统机器人步态规划控制方法存在的问题,利用强化学习步行控制器对其进行改进,并用仿真实验和真实实验证明了方案的可行性,得出了基于强化学习的步态控制方法可以生成具有一定仿生性和鲁棒性的双足机器人步态的结论。
其他文献
目的:探讨PD-1抑制剂治疗晚期肺癌患者的疗效及其对患者外周血T淋巴细胞亚群及细胞因子水平的影响。方法:选择2018年8月至2020年12月于海口医院就诊的肺癌患者50例,选取同期体检健康者50例作为对照,免疫组化法检测肺癌组织中PD-1的表达。肺癌患者均接受纳武利尤单抗(nivolumab)或帕博利珠单抗(pembrolizumab)治疗,于治疗前1天、治疗1周期结束、治疗4周期结束时进行静脉血
在过去20年中,随着治疗手段的不断发展,极大改善了2型糖尿病(T2DM)患者的预后,但心血管疾病(CVD)仍是T2DM患者死亡的主要原因[1-3]。越来越多证据表明钠-葡萄糖共转运蛋白2(SGLT2)抑制剂和胰高血糖素样肽1受体激动剂(GLP-1RAs)能显著降低主要不良心血管事件(MACE)的风险[4-11],且SGLT2抑制剂还可以显著降低心力衰竭(心衰,HF)住院和糖尿病肾病(DKD)
期刊
温室气体排放影响人类生存环境,节能减排和减碳固碳现已成为全球生态建设的重要目标。创新研究以唐山市为例,从景观规划设计角度出发,深入分析园林景观构成要素基础上,提出双碳战略目标实现的策略和路径,并进行思考总结,获得唐山学院2021年省级大学生创新创业训练计划项目立项,为双碳战略目标下景观规划设计和教学研究方向提供了参考。
本文首先阐述了国内外学者对计算机视觉中基于图像建模的机理研究及其应用,提出该领域需要进一步探索与完善。在此基础上,简要地概述了计算机视觉系统中基于图像三维建模。首先论述了计算机视觉系统形成三维场景的机理,然后分析了基于计算机视觉系统的图像信息获取与整合的必要性,最后从三维场景提取变成目标物体、目标物体转化为三维模型两个方面论述了模拟计算机视觉过程的三维模型提取和转化。
期刊
英国科研人员在近期召开的英国国立癌症研究所年会上发表的最新研究报告表明,女性长期失眠、经常熬夜可增加患乳腺癌的风险。研究人员分析了包括40.9万名女性在内的两个数据库,以研究睡眠与乳腺癌之间的联系。研究发现,与正常早睡早起的受试者相比,经常熬夜和长期失眠的受试者罹患乳腺癌的风险要高出40%。研究同时发现,若每晚睡眠时间超过7~8小
期刊
通过分析单一测绘数据在构建实景三维模型中的各种弊端,引入机载LiDAR点云、正射影像与倾斜摄影测量等多源数据融合构建精细三维模型关键技术的探讨。借助某地房地一体项目,对多源数据融合技术进行了实测与精度评定。结果表明融合后的三维模型结构纹理更清晰、完整,地物检查点高程中误差得到了极大的提高,完全满足1∶500大比例尺测图项目的规范要求,该融合技术为同类项目的设计与实施提供了参考。
目的研究一种从连翘果实中分离连翘苷的有效方法,并利用提取分离出的连翘苷作为底物,为其转化产物连翘脂素的工业化生产提供研究基础。方法利用70%乙醇对2.5 kg连翘干燥果实进行粗提,萃取乙酸乙酯部位,经过层析得到连翘苷纯品;选择32种菌株对连翘苷进行微生物转化,以连翘脂素的产量为指标,利用微生物转化工艺,筛选出有较强的转化能力且专一性的菌株。结果分离纯化得到目标化合物连翘苷6.8 g,经高效液相色谱