【摘 要】
:
随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中对某种目标物品按某种物理属性进行快速分拣的能力。本文采用深度强化学习算法DDPG(Deep Deterministic Policy Gradient)代替在机械臂控制中的逆运动学解算方法,通过数据驱动的训练过程控制机械臂到达目标位置,从而抓取目标物体,达到分拣目标物品的目的。
论文部分内容阅读
随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中对某种目标物品按某种物理属性进行快速分拣的能力。本文采用深度强化学习算法DDPG(Deep Deterministic Policy Gradient)代替在机械臂控制中的逆运动学解算方法,通过数据驱动的训练过程控制机械臂到达目标位置,从而抓取目标物体,达到分拣目标物品的目的。首先在2D机械臂仿真环境中,使用不同的奖励函数形式和状态向量设置形式进行训练,对比DDPG算法模型的收敛性与收敛速度,分析得到最优的设置形式。接着将DDPG算法的设置形式从2D仿真环境迁移到3D仿真环境中,在ROS(Robot Operating System)的Gazebo 3D仿真环境下进行DDPG算法的训练,分析比较得到最优的结果,保存其神经网络权重。最后使用视觉识别算法识别定位目标物品并结合已保存的神经网络权重,控制真实的Dobot Magician机械臂完成对目标物品的抓取和分拣。本文提出了一种基于深度强化学习的机械臂智能控制训练方法,采取2D环境到3D环境迁移的训练方法,极大的缩短了训练时间。训练得到的控制模型结合视觉识别算法,实现了真实机器臂对空间环境中物体的抓取和分拣操作。验证了将强化学习应用到真实机械臂控制的可行性和有效性。
其他文献
近年来,笔者以中西医结合治疗肝硬化腹水108例,取得较满意疗效,现报道如下。一、一般资料108例中,男性81例,女性27例。年龄最大者68岁,最小22岁,以
肝硬化患者常出现顽固性腹水,治疗颇为复杂。临床常将限制钠盐摄入定为守则。笔者则认为不限制钠盐进量,有益康复。就本科收住的48例三型肝硬化腹水患者分两组对比,作一报道。
肝硬化腹水是慢性肝脏疾病晚期并发症之一,既往的综合治疗多限于利尿,然而,部分患者疗效欠佳。随着对肝硬化病理生理及发病机制研究的深入,近来有效治疗方法颇多。本文就肝硬化腹水的
大约10%~20%肝硬化腹水患者可发生自发性细菌性腹膜炎,而并发自发性细菌性脓胸报告甚少。现将我院收治2例报告如下:例1,男25岁。以胸闷半年,发热、气急、腹痛4天入院。4年前患“乙型肝炎”。,半年前发现胸水。查体:T38.4℃,R32次,全身皮肤及巩膜轻度黄染,右侧胸廓饱满,第二肋以下叩诊实音,腹肌紧张,全腹均有压痛、反跳痛。移动性浊音(±),
患者男,74岁。因肝炎后肝硬化腹水,冠状动脉硬化性心脏病于1992年6月17日入院,给予保肝,利尿,扩冠等中西医结合治疗。于入院后42天患者心跳呼吸突然停止,当即给予胸外按压,人工呼吸、吸氧等治疗,心电图为一直线,立即静推盐酸肾上腺素1mg、洛贝林、可拉明各1支,无效。2分钟后,再重复上述药物及剂量各1次,心电图仍无心电活动。加大肾上腺素剂量为3mg 静推,继续胸外心脏按压,至抢救20分钟
直肠肿瘤是直肠癌前期特征,是产生直肠癌的重要依据。因此,利用算法准确的分割直肠肿瘤的位置和大小是一项具有挑战性的任务。在诊断直肠癌的过程中,从CT影像中自动准确分割出直肠肿瘤区域,有助于提高医生的诊断速度和准确性。直肠肿瘤分割是非常具有挑战性的技术,也是医学图像分割中比较有意义的一项工作。因此,本文针对直肠肿瘤分割问题,提出基于U-Net改进模型的直肠肿瘤自动分割算法。首先在U-Net模型的每级编
腹水症是多种疾病发展到一定阶段的一个临床表现。临床上除对这些疾病本身进行治疗外,对腹水的解除也是一个重要环节。笔者用验方消臌散治疗多类腹水21例,疗效满意。其中男10例,女11例;年龄最大60岁,最小35岁,平均51岁。肝硬化腹水11例、结核性渗出性腹膜炎6例、肾病综合征2例(一例合并胸水及心包积液)、腹腔肿瘤2例。以上均通过有关检查确诊。
近年来,深受广大研究者青睐的群智能优化算法(EAs)很大程度上提高了复杂优化问题的求解,并将其用于多种领域的研究。其中,猴群算法(Monkey Algorithm,MA)对于大规模多峰优化问题的求解性能相对较高,应用前景较广。但在一些较大规模离散问题的求解上,MA还存在一些缺点,因此对MA的进一步研究,具有重要的现实意义。针对MA在大规模离散问题上的求解性能,本文主要选用折扣{0-1}背包问题(D
波动方程是描述自然界中各种波动现象的一种双曲型偏微分方程,其发展应用于各个领域,但其解析解难以求得,因此波动方程的数值求解显得越发重要。人工神经网络是能够以任意精度逼近偏微分方程的解析解,是求解波动方程数值解的一个重要工具。本文主要就人工神经网络算法求解波动方程以及该算法的改进作出如下的研究:第一章主要介绍了神经网络的背景知识及其发展的国内外现状,并简述了本文所做的工作。第二章介绍了神经元模型及单
机器人的诞生让人们的生活更加智能化。其中,具有自主移动功能的移动机器人更是当下非常热门的科技成果。路径规划是移动机器人执行各项任务的前提,它决定了移动机器人是否能够在作业区域内安全、高效地执行任务,对移动机器人的性能具有十分重要的影响。现有国内外文献对移动机器人的发展动态和路径规划均作了大量的研究,但对移动机器人从某个起点出发、经过多个目标点并避开障碍物、最终返回起点的情形研究还较少,本文选取这类