论文部分内容阅读
在工业自动化生产线中,完成搬运、装配等作业的示教型工业机器人都需要具有抓取物体的功能。但是,这种示教型操作机器人不能适应多品种、小批量的现代生产模式,需要开发具有感知、决策、控制功能的自主操作机器人,以实现自主抓取功能。本文以通用的机器人操作系统(ROS)作为开发环境,研究自主操作机器人的视觉感知、路径规划以及运动控制的实现方法;针对抓取不同对象的多种特征,研究基于深度强化学习的自主操作机器人抓取策略。本文主要研究工作及成果如下。1.基于ROS的自主操作机器人建模与控制系统设计。以6自由度操作机器人和工业CCD相机为基础,建立ROS中用于机器人建模格式的URDF模型,其中包括:运动学模型、可视化模型、动力学模型和碰撞模型。采用TF软件库在ROS中实现机器人的父关节与子关节之间的坐标变换,并根据这些信息构造出机器人的完整运动学树状结构。搭建图像处理、运动规划、伺服驱动等功能模块的逻辑设计和系统级联:通过节点(node)建立ROS与机器人、相机之间的通信,获取机器人状态数据和图像流;基于ros control软件框架为关节伺服电机建立PID位置控制器,用以完成机器人的规划路径,并且能按照期望的设计目标对机械臂关节实现有效的控制。2.基于ROS的操作机器人环境感知、路径规划与运动控制仿真实验。分析对比快速搜索随机树(RRT)方法与改进的RRT_Connect算法,改进的RRT_Connect算法的平均规划时间比RRT算法速度快88.4%。基于OpenCV实现标定板相对于相机坐标系位姿的求解和手眼矩阵的求解;通过视觉图像处理,获取目标物体在机器人坐标系下的位姿;采用RRT_Connect算法实现操作机器人从初始位姿到目标位姿的路径规划,通过PID位置控制器对各关节的伺服控制,实现机器人末端规划路径的跟踪控制;在Gazebo仿真器中进行路径规划与运动控制的可视化仿真,完成操作机器人的自主抓取操作。3.深度强化学习算法及其在操作机器人抓取策略中的应用研究。针对强化学习对于超大状态空间难以处理问题和深度强化学习(DQN)算法训练时间长的问题,采用结合了Q-Learning与梯度策略的Actor-Critic算法进行机器人抓取策略的研究。鉴于PyBullet仿真器在深度强化学习训练环境的优越性,采用该仿真器中的KUKA机器人进行抓取训练仿真实验。针对抓取对象的各种不同特征,采用随机生成五个不同形状的零件作为抓取环境,通过Kinect相机的深度图像作为Actor网络的输入,将机器人实际执行的动作作为Critic网络的输入,建立了端到端的训练模型,经过训练和测试,验证了算法的有效性。在相同环境下与DQN算法相比,本文采用的算法学习效率和抓取成功率更高,执行步数更少。