基于深度图像与深度强化学习的机械臂抓取控制研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lych001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使机械臂抓取几何结构未知的物体,以及在物体位置变化时自主规划运动路径,本文利用图像深度信息和卷积神经网络实现机械臂预测最佳抓取位姿,运用深度强化学习算法实现机械臂自主执行抓取操作。对于预测最佳抓取位姿的任务,本文在网络深度、卷积核大小等方面对生成抓取卷积神经网络进行改进。使用来自Jacquard抓取检测数据集中的样本训练并测试改进的神经网络。抽取Jacquard数据集中的样本组成验证集来验证网络泛化性能,取得了最高87.5%的预测准确率。配有深度相机的六自由度仿真机械臂搭载泛化性能较好的网络模型,在机器人操作系统中进行抓取物体的实验。对于静态的物体使用开环抓取的方式,对于动态移动的物体运用视觉伺服进行闭环控制抓取。各个实验最终在测试集上均取得了超过80%的抓取准确率。对于机械臂自主控制末端到达目标区域的任务,构造二维仿真机械臂,运用深度确定性策略梯度算法训练机械臂自主完成任务。针对奖励函数和回放经验采样策略两方面对算法体系做出改进,并通过仿真实验进行对比。实验结果显示,两种改进方式都可以提高机械臂在执行任务时的收敛速度和稳定性。为实现机械臂自主抓取物块,在机器人操作系统中搭建三维仿真机械臂。将深度强化学习算法的改进方案迁移到其中,通过实验对比显示,改进方案有利于深度强化学习算法训练机械臂提高抓取物块的成功率。
其他文献
本文采用下潜源思想改进的H-S方法,运用“平面镜像原理”对有限水深中的任意形状无升力体绕流问题进行了研究,并编制了相应的程序以圆球绕流为例进行了数值计算。文中首先概
上接570期《技术创新能力评价指标(上)》三.宏福公司技术创新能力评价1.指标上节逐一说明评价企业技术创新能力的统计数据指标(S型指标)和经验数据指标(E型指标)。统计数据指标共19个
大多数人对政务信息既熟悉又陌生,熟悉是因为政务信息这个词出现频率高,是常见词;陌生是因为未深入了解政务信息的内涵,不清楚其内容和功用。笔者据工作实践,就水利政务信息谈如下
在语文教学过程中,越来越多的学生使用“参考答案”。本文对这一现象进行了分析,并对其对教学的利弊进行了讨论,并对如何对待“参考答案”提出了自己的看法。 In the langua
[摘 要]我国目前公共产品的提供多采用垄断经营方式,在公共产品定价及经营过程中往往忽略或侵犯了消费者的参与权、选择权和公平交易权等合法权益,要解决这一难题,在公共产品垄断经营这一特殊领域就要打破绝对垄断格局,允许公有公营、公有民营或私有私营等多元主体经营方式存在,采取自然垄断性环节与竞争性环节相分离的经营模式,针对不同情况实行不同政策。   [关键词] 公共产品定价 公共产品经营 消费者权益 政府
目前,同行评议是许多期刊采用的用以提高期刊质量的一种评价方式。但是,同行评议的公正性、公开性和时效性问题也一直是研究人员所质疑的焦点。本文针对期刊同行评议过程的公
钢筋砼筒仓在物料侧压力作用下,仓壁的的一般工程设计计算,采用的是一种简化方法,这种方法忽略了仓壁沿高度方向的连续性,仓壁上部以及仓壁下部没有承受水平压应力一段筒仓壁段以
四神图像从汉代开始传入河西,集中出现于魏晋时期河西墓葬中,其形式与内涵与中原地区保持一致。河西地区魏晋时期的四神图像大多集中在酒泉、嘉峪关、敦煌三个区域,表现形式
当今社会,随着国家的经济快速发展,卷烟市场环境在提出“卷烟结构升级、终端形势裂变、消费市场转型”的背景下,准确采集卷烟市场数据,并实现分析市场状态信息和应用信息,直
随着社会的发展,信息时代的进步,数学越来越广泛地应用于生产与生活中的各个方面。与之对应,数学建模越来越被数学学习和解决现实问题置于较高的地位。因此,提升数学学习能力