【摘 要】
:
基于视觉的目标物体位姿识别具有广泛的应用场景,例如利用机械臂完成目标工件的抓取,分拣与姿态调整等等。当前构建一套成熟的物体位姿识别系统协助机械臂抓取还存在许多挑战。本论文从工业实际应用出发,利用传感器获取初始的彩色图像与深度图像数据,结合目标物体模型参数等作为先验知识,完成目标物体的位姿识别。针对应用中需要处理的物体存在的弱纹理,复杂形状等特性,提出了一种利用物体轮廓特征和消费者级RGBD传感器的
论文部分内容阅读
基于视觉的目标物体位姿识别具有广泛的应用场景,例如利用机械臂完成目标工件的抓取,分拣与姿态调整等等。当前构建一套成熟的物体位姿识别系统协助机械臂抓取还存在许多挑战。本论文从工业实际应用出发,利用传感器获取初始的彩色图像与深度图像数据,结合目标物体模型参数等作为先验知识,完成目标物体的位姿识别。针对应用中需要处理的物体存在的弱纹理,复杂形状等特性,提出了一种利用物体轮廓特征和消费者级RGBD传感器的位姿识别方案。在识别物体位姿时,本论文尝试将直接估计目标物体的位姿的一阶段处理过程,转换为先分类确定基础类型,再根据基础类型获取初始位姿状态并优化的两阶段处理过程。算法预先根据物体在不同位姿下可视面表现划分出类别,引入类别与对应位姿之间的联系作为先验,可实现根据类别获取对应的初始位姿的效果。利用先验将回归计算问题转换为分类问题,降低了问题计算难度。在实际应用时,成功获取目标物体种类以及对应的剪影轮廓数据后,模型识别输入目标物体当前状态所属类别,获取先验中对应的位姿数据作为初始位姿,并进行迭代优化改进优化识别结果。分类可利用模板匹配的最相似模板搜寻策略实现,也可通过基于卷积神经网络分类模型实现。基于模板匹配的最相似模板搜寻策略利用自定义的模板数据,使用对应的模板相似度评价方案极大化同类模板相似度的同时,增强对异类模板数据的筛选能力。利用卷积神经网络的分类模型则是从初始数据中提取特征,利用多层感知机网络实现分类。分类模型的训练使用渲染的图像数据,为减弱与实际图像之间的差异,渲染的图像数据经过处理保留目标物体的二值轮廓剪影数据。此外,根据成像原理,物体的位置会对成像中物体的可视面产生影响,导致分类结果错误。针对这种情况,也提出了利用物体的平移参数对分类获取的初始位姿的补偿方案。为测试提出的位姿估计方案在实际任务上的表现,本论文选用了几种具有较好识别效果的常用位姿估计算法进行实验对比。在测试基于模板匹配的分类方案时,选用了工业界内使用的三种零件,并限定了其放置的姿态种类个数,与其他方法对比具有较好的工作效果。在测试基于卷积神经网络的分类方案时,没有限定初始位姿种类而是任意放置目标物体。实验对象除了三种常用的工业零件,也包括若干常见的位姿识别数据库中的物体。与其他常见的利用了纹理信息的位姿识别方案相比,尽管该分类算法舍弃了渲染图像的纹理特性,在其分类基础上计算的位姿数据仍具有更小的误差与更好的识别准确率。
其他文献
在C型臂X光影像引导下的椎间盘射频消融术是一种经皮穿刺治疗椎间盘突出的微创手术,具有创伤小恢复快的优点,其中穿刺针的精准定位是手术关键。传统的椎间盘射频消融术手术时间长、操作流程繁琐,医生受X射线辐射危害,没有保护机制,容易穿刺失败。为解决以上问题,本文设计了一套脊柱穿刺手术机器人系统,并针对机器人系统的交互引导控制展开研究,协助医生安全、高效的完成手术。针对脊柱穿刺手术机器人特点,本文首先通过分
视觉问答是一项属于计算机视觉和自然语言处理交叉领域的任务,它要求模型读取输入图像和相关的自然语言问题,并给出合理的答案。与图灵测试相关的问答系统始终是人工智能研究的重点之一,而视觉问答模型不仅要实现机器的思考和推理能力,还要完成图像信息和文字信息的统一语义表达。该任务对于探寻机器智能的实现和构建跨媒体信息统一模式都具有重大意义。本研究首次通过跨模态检索方法来提高视觉问答任务的效果。现有方法没有关注
在自动驾驶中,精确地感知周围环境至关重要。随着科技的发展,传统的三维目标检测算法由于速度缓慢,准确率不够高,正在渐渐地被基于深度学习的算法所取代。目前,由于计算力发展迅速,以及激光雷达能够精确给出目标三维外观以及位置的优点,大部分的三维目标检测算法都选择了激光雷达作为数据来源。点云数据具有数量庞大的特性,且有着与图像数据完全不同的格式,如何用深度学习有效地处理点云数据是研究的重点和难点。作为自动驾
桥梁作为交通系统的重要组成部分,对其进行定期检测以确保其安全性及可靠性是一项十分重要的工作。传统人工检测方法效率低,精度差,成本高,难以满足当前桥梁检测的巨大需求。随着计算机及图像处理技术的迅速发展,基于机器视觉的桥梁检测系统逐渐成熟。针对目前桥梁裂缝图像检测系统中裂缝识别率不高,裂缝宽度测量精度不足等问题,本文提出了一种基于卷积神经网络的裂缝识别算法以及裂缝宽度亚像素测量算法。论文的主要工作如下
化学传感器广泛应用在许多领域,包括环境监测、临床诊断、医疗保健、安全警报和食品质量检查等。在化学传感器的许多应用场景中,快速获得传感结果是非常必要的,比如易燃易爆气体的警报或有毒物质的检测,减少检测时间还可以改善用户体验、降低功耗。然而,许多化学传感器都有着响应时间长的问题。为此,一种经济有效的解决方案是通过数据处理算法根据早期瞬态响应数据预测最终结果,即被分析物的浓度或类别,但目前相关工作的方法
车辆尾气中的NOx会造成严重的环境污染,选择性催化还原(SCR)技术通过喷射尿素水溶液进而分解生成NH3来还原NOx,但其喷射过多造成的“氨泄漏”同样后果严重,因此有必要在SCR下游设置合适的传感器来检测NH3浓度。在众多类型传感器中,混合电位型固体电解质传感器因为结构简单、适应性好、传感性能优异而具有非常广阔的应用前景。因此,研究氨气敏感材料的形态与氨气传感器的结构,进而提高对NH3传感性能具有
随着自主式水下机器人(Autonomous Underwater Vehicle,AUV)智能化的发展,人工智能方法在其关键技术上得到了越来越多的应用。强化学习是一种重要的人工智能方法,在与环境的交互中自学习决策模型,弱化了对模型和环境的约束,具有相当高的灵活性。本文基于强化学习算法,研究在海流影响下的AUV长距离二维路径规划问题,提高AUV在复杂环境中的灵活性和适应性。本文具体工作如下:首先,以
新能源共享汽车是一种基于共享经济的新型出行模式,在以往的研究中,研究者普遍忽略车辆的电量问题,但是随着我国新能源汽车在共享汽车行业的占比越来越高,车辆续航里程和充电问题已经是不可再忽略的因素,否则相关研究就脱离了实际意义。因此,本文针对共享汽车的运营问题,并以车辆续航里程和充电时间为背景,分别对新能源共享汽车中的最小车辆编队、车辆调度、以及定点拼车等进行研究。主要内容如下:1.针对考虑车辆续航里程
本文的主要目标是在各种未说明的空间约束下,分析不同强化学习策略对机器人器械护士(RSN)应用的影响,尤其是对其“到达者”任务的影响。这一任务是机器人操纵任务中最重要的方向之一。本文提供了我们的对于不同空间约束下的“到达者”任务的实验结果和评估。我们使用了强化学习算法DDPG-HER和SAC-HER对各种未说明的空间约束进行测试。本算法基于7 DOF机械臂进行实验评估。实验结果采用奖励价值和成功率作
本论文设计、研究了国内大型枢纽机场下穿通道群的综合监控系统。该机场下穿通道群包含了国内某大型枢纽机场的四条下穿通道,用于让机场内部车辆快速穿越飞机滑行道,提升机场运营效率。而本文设计的机场下穿通道综合监控系统可以使得机场管理人员在同一个平台上对机场下穿通道群的现场环境,实时交通状况,附属设备状态及各类异常报警事件进行监控及管理,保障车辆在下穿通道的安全行驶。本文在参考了公路隧道监控系统的基础上,并