机器人抓取三维物体的神经网络及优化算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ck198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人抓取三维物体是机器人最常用的基本动作之一,研究机器人抓取技术是智能服务型机器人大规模应用于日常生活的关键。机器人对目标物体的识别是抓取的基础,现有的主动式目标物体识别算法普遍存在识别损失函数相对于识别位置不可导的问题;同时,现有的机器人抓取规划算法多数只适用于低自由度抓取器,而少数针对高自由度抓取器的规划算法却无法快速而有效地生成高质量的抓取姿态;在利用平面连杆结构做机器人设计时,存在无法联合优化拓扑和轨迹的问题。针对以上问题,本文分别从神经网络结构设计、损失函数设计、优化算法设计等方面研究解决的方案,主要创新点总结如下:1.主动式视觉本质上是注意力驱动的:机器人为了更加快速地完成任务,会主动选择视角,并不断地更新机器人对于所观察环境的内部表达。注意力模型算法已经在基于RGB图像的二维视觉领域取得了很大的成功。受此启发,本文提出一种新的基于循环神经网络端到端的注意力模型,该模型可以解决基于多视角深度图的目标物体识别问题。该模型利用循环神经网络的优点,主动地变换视角并更新机器人对于所观测环境的内部表达。通过在已有的三维数据集上进行训练,该模型能够针对一个待识别的目标物体,不断地寻找该物体的下一个最佳视角,并最终达到识别该物体的目的。为了实现三维视角的自主选择,本文提出一种新的三维空间变换网络,该网络模块是完全可导的,能够实现端到端的训练,因此它比现在通用的深度强化学习收敛更快。实验表明,针对下一个最佳视角问题,该算法在仅有深度图的情况下,实现了最高的物体识别率和最好的时间效率。2.本文提出一种利用神经网络来表征高自由度抓取器抓取姿态的方法。高自由度抓取器的抓取姿态具有冗余性,也就是说,对于给定的一个目标物体,存在大量同样合理而有效的抓取姿态。这使得神经网络学习一致性的抓取姿态变得很困难。本文首先构建一个数据集,该数据集中的目标物体囊括了已有的四个公开数据集中的物体,同时每个目标物体都有很多有效的抓取姿态;然后,对该数据集进行增强,这将使得神经网络的训练更加有效;其次,利用该数据集和一致性损失函数来训练一个神经网络,该神经网络可以建立从目标物体到抓取姿态的一对一的关系,以此来解决抓取的一致性问题。同时,通过一个碰撞损失函数来防止抓取器穿透物体,以进一步提高生成的抓取姿态的质量。抓取质量是衡量一个抓取姿态好坏的标准,抓取质量越高,则机器人抓取物体时,抵抗外力扰动的能力越强。相比较作为基线方法的监督学习而言,该方法能够为高自由度抓取器生成更高质量的抓取姿态。生成的抓取姿态的质量与数据集中作为标注数据的抓取姿态的质量相近。同时,对于从多视角深度图重建出来的、带噪声的物体模型,该方法具有足够的鲁棒性为其生成高自由度抓取姿态。这种鲁棒性使得该方法可以在24自由度的Shadow Hand真实机器人平台上实现。3.为了使机器人成功抓取未知的目标物体,本文提出一种端到端的算法来训练神经网络。该算法基于前向反向自动求导方法实现了抓取规划器所涉及的基本模块,包括抓取器的前向运动学、抓取器和物体之间的碰撞处理以及抓取物体时的抓取质量。一个典型的机器人抓取姿态包括抓取器腕部的位置和朝向(外部自由度),以及抓取器夹爪的闭合程度或者手指的关节角度(内部自由度)。特别地,本文提出了一种通用的Q1抓取质量,该抓取质量的计算是可导的。因此,即使在抓取器与物体并没有发生接触的情况下,也可以利用该抓取质量来针对神经网络直接输出的抓取姿态进行优化。这与传统的抓取质量必须要求抓取器接触目标物体不同。同时,该抓取质量的偏微分可以通过相关优化问题中的灵敏度分析来计算。本文通过分析认为,在抓取过程中产生的碰撞(即抓取器与物体之间的碰撞以及抓取器内部夹爪或者手指的自碰撞)损失函数的偏微分,可以通过一个低质量的闭合三角网格来计算。该算法可以在没有抓取训练数据的无监督训练模式下,为高自由度抓取器规划出针对已知目标物体的抓取姿态,同时也可以在有监督训练模式下,通过利用小规模数据集来提高抓取规划的有效性,并且针对未知目标物体也具有良好的泛化能力。在基于学习的抓取规划算法中,该算法可以极大地简化准备训练数据的过程。同时,针对已有的三维模型数据库,该算法相对于基线算法提高了0.12的Q1抓取质量和22%的真实机器人抓取成功率。4.本文提出一种上下两层的分支定界算法,在一个约束的搜索空间中计算最优的抓取器姿态,并最大化抓取质量。该方法考虑了抓取器的运动学约束,以确保在有解的情况下,一个给定的抓取器能够顺利抵达预定的抓取点而不与物体发生碰撞;或者在有限的时间内证明,预定的抓取点不存在与之对应的合理的抓取姿态。主要的技术贡献在于,针对抓取器的逆向运动学约束,提出了一种新颖的基于混合整数凸规划的算法,该算法仅涉及少量的二元整数变量和紧致的约束条件。同时该算法可以利用分支定界算法来有效地求解。实验表明,在一台桌面级计算机平台上,该方法可以在20分钟到80分钟之内为不同目标物体规划出最优抓取姿态,同时所规划抓取姿态的Q1抓取质量,比以往基于采样的抓取规划方法要更好。5.本文提出一种新的算法来联合计算平面连杆结构全局最优的拓扑和轨迹。平面连杆结构能够在只有一个可旋转驱动器的情况下,生成复杂的末端执行器轨迹,这对于生产低成本机器人是非常有用的。针对求解这些结构的全局最优拓扑结构和几何特征,本文提出了一种新的优化方法,该方法解决了拓扑变化的不光滑和不可导的问题。本文将该问题形式化成一个混合整数凸规划问题,并利用分支定界算法来求解全局最优解。从结果上看,该方法能在有限的时间内,生成一个平面连杆结构以使得其末端执行器的轨迹与用户提出的目标轨迹尽量重合。通过测试,该方法能够自动生成带有57个刚性连接杆的平面连杆结构。与基于采样的方法或者模拟退火算法比较,该方法将解的质量提高了最多7倍。同时,优化过的平面连杆结构在四足行走机器人和机器人抓取器上得到了验证。
其他文献
传统机器学习的一个基本假设是测试数据与训练数据服从相同的分布,然而这一假设往往在实际应用场景中因过于严格而难以成立。近来,以深度学习为代表的机器学习方法在各领域都取得了长足进展,然而人们认为机器学习模型优异的性能依赖于大量的标注数据,而对数据进行标注通常是耗时、费力和代价昂贵的。迁移学习放宽了传统机器学习的基本假设,因而能够利用某些领域(源域)已有的标注数据辅助解决新的领域(目标域)中的应用问题,
学位
电控固体推进剂(Electrically Controlled Solid Propellant,ECSP)是近年来发展的一种新型固体推进剂,在外加电压或电流作用下可实现多次重复点火和燃速的实时调控。基于电控固体推进剂的固体火箭发动机结构简单,无点火器和活动部件,既可以长时连续工作,也可以短时脉冲工作,比传统固体火箭发动机表现出更高的机动性和灵活性,是未来弹箭武器主动力和姿轨控发动机的理想动力装置
学位
星载合成孔径雷达(SAR)层析技术,利用同一目标的多角度相干测量,在高度向上形成合成孔径,从而实现对观测目标的立体三维成像。由于具有高度向分辨率,SAR层析成像能够分辨出叠掩在同一像元内的多个散射元目标,为叠掩目标分辨提供了一种有效的技术途径,是雷达成像领域未来重要的发展方向。目前,星载SAR层析成像技术被广泛应用于军事侦察、地球遥感等多个领域。本文围绕星载SAR层析技术在城区三维成像应用中面临的
学位
电离层是地球高层大气中被电离的部分,其中的带电粒子足以影响电磁波的传播,将导致相位超前、群延迟、色散、法拉第旋转(Faraday Rotation,FR)以及幅相闪烁等效应,势必会对星载合成孔径雷达(Synthetic Aperture Radar,SAR)造成一定程度的影响。随着工作频率下降、带宽以及合成孔径时间增大,星载SAR的成像性能将更容易受到电离层效应的影响。因此,对于低波段星载SAR、
学位
战术移动自组织网络(Mobile Ad Hoc Network,MANET)是在战场环境下由一组自治的设备或者节点组成的即时性网络,具有不依赖基础设施、易部署、无中心、自组织、高动态等特点。对战术MANET进行节点、网络属性的监测与分析在网络安全性分析与对抗等领域具有重要支撑作用。传统的网络可接入、信息内容可解析条件下的监测分析技术必须以接入和解密为前提,应用场景受到极大限制特别是主动式探测式监测
学位
过去的几十年,以社交网络和搜索引擎为典型的互联网技术、新兴的物联网技术等带来了蓬勃增长的视觉图像数据。以机器学习、深度学习等为代表的人工智能技术极大地促进了对图像的认知能力。但爆发式增长的视觉数据分布呈现出显著的复杂性、动态性、隐私性特点,对现有的深度模型、算法、框架提出了更高的要求。因此,本文立足于不同应用场景,从数据分布驱动的角度研究学习系统可以利用的归纳偏置,通过设计新的或者改进现有的深度模
学位
核磁共振陀螺基于原子核自旋在磁场中的拉莫尔进动敏感角速度,被认为是未来高精度小尺寸陀螺仪的主要发展方向之一。核磁共振陀螺一般采用碱金属(如87Rb、133Cs)蒸气与稀有气体(如129Xe/131Xe)的混合气体,角速度信息加载在稀有气体原子核自旋的进动频率上,而核自旋的进动信号由碱金属原子构成的磁力仪来检测。因此在核磁共振陀螺中,原子磁力仪具有重要的作用,其稳定性、灵敏度等指标直接影响核磁共振陀
学位
空基和天基雷达成像系统的侦察能力日益增强,使得高价值目标的部署和机动无所遁形。如何有效控制目标的雷达特征,使其不易被成像雷达发现和分辨,已经成为目标防护领域的关键问题。相对于有源防护措施,依靠电磁调控材料的反射式防护方法具有响应时间快、不易暴露、与天然环境融合等优势,这对于降低高价值目标的发现概率具有重要的意义。本文以人工电磁材料调控技术为主线,以降低高价值目标雷达成像特征为目的,对成像雷达目标特
学位
文本问答通过理解问题的自然语言描述并依据不同形式的知识源给出问题的答案,这是自然语言处理领域中最具难点的挑战之一,一直受到学界和产业界的广泛关注和研究。尽管过去几十年的研究取得了很大的进展,文本自动问答系统在语义理解、文本生成等方面仍然面临一些尚未解决的问题,比如对于复杂的自然语言问题的语义理解仍比较困难;用于无结构化问答的文本生成技术在语义一致性、信息多样性等质量属性上存在不足。另一方面,海量的
学位
论文针对卫星拒止条件下的小型无人机自主返航问题,从仿生传感器测量误差补偿和仿生导航方法两个层面,研究了无人机自主返航仿生导航方法。主要研究成果总结如下:首先,提出了一种像素化偏振成像芯片耦合误差建模及标定方法。分析了阵列式偏振片与成像芯片的耦合工艺误差对透过率和消光比的影响,建立了耦合误差模型和相机线性响应误差模型;基于马吕斯定律推导了包含误差参数的光强响应函数,设计了一种耦合误差标定方法;采用室
学位