采用DDPG的双足机器人自学习步态规划方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cfj4208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决多自由度双足机器人步行控制中高维非线性规划难题,挖掘不确定环境下双足机器人自主运动潜力,提出了一种改进的基于深度确定性策略梯度算法(DDPG)的双足机器人步态规划方案。把双足机器人多关节自由度控制问题转化为非线性函数的多目标优化求解问题,采用DDPG算法来求解。为解决全局逼近网络求解过程收敛慢的问题,采用径向基(RBF)神经网络进行非线性函数值的计算,并采用梯度下降算法更新神经网络权值,采用SumTree来筛选优质样本。通过ROS、Gazebo、Tensorflow的联合仿真平台对双足机器人进行了模
其他文献
随着大数据和5G时代的到来,数据中心承载的数据量极速增加,系统设备变得庞杂,对基础设施运维管理提出了更高的要求,传统IDC运维系统的缺陷越来越明显。主流的DCIM平台功能并
当前,高容量和高电压水平的变压器产品已经成为电力行业最为重要的设备之一。由于插入电容屏蔽式线圈在变压器中具有十分重要的作用,因此研究分析了变压器插入电容屏蔽式线圈
讨论光伏照明充电技术,通过前期的实验和研究,设计了一款用于景区的光伏发电装置。此装置结合光伏发电和“互联网+”思想,利用手机App实现充电桩导航、电量和使用情况查询以
目的:探讨颅内动脉狭窄与闭塞诊断中MR增强血管成像的应用价值。方法:选取2017年1月-2019年1月我院收治的颅内动脉狭窄与闭塞患者128例,将DSA检查作为金标准,分别行数字减影
目的:选用64排MSCT、1.5T MRI增强扫描方法,探讨主动脉后型左肾静脉(Retroaortic left renal vein,RLRV)患者的影像学征象及诊断价值。方法:1、回顾性收集10例2018年01月-202
针对关键岗位的人员行为分析的问题,提出了一种基于视频的行为分析方法。制作了包含多姿态样本的岗位人员行为数据集,并使用YOLOv3网络训练该数据集得到行为检测模型。使用提出的人员行为分析算法结合行为检测模型对视频进行处理,对人员行为进行初步分析。在人员行为分析算法的基础上,结合图像相似度和明暗度等特征,进行深度分析并给出离岗、睡觉和玩手机事件的判断结果。实验结果表明,制作的数据集在人员行为检测中有较
为了有效地确定滚动轴承的故障类型和受损程度,提出了结合马田系统和SVM的滚动轴承故障模式分类方法。利用EEMD方法对原始振动信号进行分解,得到一系列IMF。经过故障敏感IMF
1临床资料患者,男,43岁,已婚,身高173 cm,体质量85 kg,吸烟20年,无嗜酒、吸毒史,既往诊断高脂血症、脂肪肝,无家族遗传史及过敏史。因腰痛伴左下肢疼痛1周,加重伴麻木3d就诊
目的:探究多层螺旋CT增强扫描应用于胃癌淋巴结转移诊断的可行性。方法:回顾性方法选择并分析2018年9月-2019年9月来我院就诊的60例胃癌病人,采用病理检测方法检测患者的胃癌
传输线路的电压等级不同,线路阻抗的特性也会随之变化。传统分布式电源并网是通过高压传输,线路阻抗近似于纯感性。而微电网由于发电单元距离用户侧较近,因此传输线路电压等