论文部分内容阅读
随着航天技术的发展和航天应用的深化,在轨运行的航天器呈现出爆发式的增长,对空间服务提出了强烈需求:失效航天器需要通过在轨服务进行清理、故障航天器需要在轨服务进行维护、正常航天器可以通过在轨服务延寿和升级。初期由航天员进行在轨服务,存在风险大、成本高等问题,也难以适应在轨服务多样化和巨量的需求;而作为典型的空间机器人,空间机械臂展示出了强大的应用能力和广阔的应用空间。因此本文以空间机械臂为对象,针对空间目标捕获问题,开展双机械臂协同运动规划研究,重点分析了快速随机搜索树(Rapidly Exploring Random Tree,RRT)及其改进算法,并提出了基于深度确定策略梯度(Deep Deterministic Policy Gradient,DDPG)的双臂协同运动规划算法,对DDPG和RRT算法进行了对比分析。论文完成的主要工作及获得的结论如下:首先,采用D-H坐标法建立了机械臂运动学模型。每个机械臂均具有三自由度结构,采用D-H法建立各连杆间的关节坐标系,基于此分别进行机械臂的正向运动学和逆向运动学分析,完成了运动学建模。其次,建立了双机械臂的协同运动任务问题的数学模型。给出了运动规划目标的数学模型及评价标准,在对机械臂运动过程中的约束分析的基础上,采用轴向包围盒法建立障碍物模型和机械臂的胶囊体模型,并给出利用层次包围盒树算法对机械臂与障碍物之间和双臂之间的碰撞进行检测的算法。再次,分析了基于RRT及其改进算法的双机械臂运动规划算法。采用了基于采样空间快速随机扩展路径的RRT算法进行运动规划研究,考虑到该算法存在一定盲目性探索效率低,在此基础上研究了它的两个改进算法双向RRT算法和RRTstar算法,在V-REP仿真环境下对这三种算法进行仿真实验的验证及性能对比。最后,提出了基于DDPG的双臂协同运动规划算法。给出了双臂协同运动规划的DDPG算法模型,并进行了网络结构和参数设计,结合V-REP仿真模型进行模型训练得到该任务的规划策略,利用训练好的模型进行双臂运动规划实验,并展开与RRT算法的比较分析。结果表明,各种算法均能有效完成机械臂运动规划任务,其中RRT算法由于扩展随机性,每次得到的规划结果不一且效率偏低;双向RRT算法改进了具有贪婪性的导向性探索,规划效率提高,但仍无法保证规划结果质量;RRTstar算法在探索过程中加入了路径优化比较步骤,使其规划结果具有渐进最优性,但由于每一扩展步骤都要进行比较增加了运算负担,使规划效率降低;DDPG算法通过不断试错对模型进行训练使规划策略逐渐得到优化,训练完成的模型可以直接利用当前策略进行运动规划,既能得到优化的路径又保证了规划的高效性。