【摘 要】
:
近年来,伴随着诸多技术的成熟,机器人产业飞速发展,逐渐成为了一个囊括军事、工业、农业、及民用服务业等各行各业的高科技新兴产业,其中家居服务型的智能机器人是近年来发展最迅速的一个方向。为了让机器人可以精确地与外界环境、其他机器乃至人相交互,必须要实现机器人对场景的理解和识别。其中语义分割算法作为机器人进行场景理解的核心,是机器人进行人工智能应用以及与外界交互的关键技术。随着2015年FCN的面世,卷
论文部分内容阅读
近年来,伴随着诸多技术的成熟,机器人产业飞速发展,逐渐成为了一个囊括军事、工业、农业、及民用服务业等各行各业的高科技新兴产业,其中家居服务型的智能机器人是近年来发展最迅速的一个方向。为了让机器人可以精确地与外界环境、其他机器乃至人相交互,必须要实现机器人对场景的理解和识别。其中语义分割算法作为机器人进行场景理解的核心,是机器人进行人工智能应用以及与外界交互的关键技术。随着2015年FCN的面世,卷积神经网络开始被广泛地用于图像语义分割任务中,并且取得了超越传统的算法的检测精度。然而,尽管语义分割算法逐渐突破,但在面对室内场景时,分割精度仍然不高。这是因为室内场景具有物体间的颜色、纹理相似;场景下光照往往不均匀;物体密度大,易存在遮挡等问题。特殊的问题导致直接将在室外场景下表现优秀的网络模型引入到室内场景时的表现差强人意。在近几年的研究中,学者们发现蕴含的大量空间信息的深度图像和RGB图像可以互相补充彼此缺失的信息,因此越来越多的室内语义分任务都使用RGB图像和深度图像相结合的技术,以RGB-D图像作为实验数据来进行意义分割任务。家居服务型的智能机器人主要在室内的场景下进行移动和交互,因此研究室内场景下的语义分割任务对于这一类机器人更好地服务于人类是具有重大意义的。综上,本文提出了两个新的基于卷积神经网络和RGB-D图像,应用于智能机器人场景识别的室内场景语义分割算法模型,在SUN RGB-D数据集上取得了优秀的分割精度。本文具体的工作和研究内容如下:首先介绍了卷积神经网络以及语义分割两项技术的相关知识。然后创新性地提出了两个基于Res Net-34网络和和RGB-D图像的优化网络模型,用来解决智能机器人面临的室内语义分割问题:1)第一个模型是基于强化监督结构和RGB-D图像的残差网络,该模型整体上使用了编码-解码的经典结构,在编码采用了分支-融合的技术对RGB数据和深度图像数据进行融合,在解码阶段本文创新性的提出了强监督模块结构,构建了一个更为精确和敏感的损失函数,有效地提高了分割精度,取得了优秀的分割结果。2)第二个模型是在第一个模型基础上的优化,整体模型结构与其基本一致,区别在于在编码阶段创新性地引进了一个空间注意力模块,将一支主要一支次要分支的结构拓展为一支主要两支次要的分支-融合结构来实现RGB数据和深度图像融合的,更多地保留了输入数据的各种细节,有效地提升了分割精度,取得了不俗的实验结果。
其他文献
自改革开放以来,特别是“一法两规”颁布后,信托业凭借着制度优势快速发展。截止2017年底,信托业资产管理规模达到24万亿,成为金融行业内仅次于银行的第二大子行业。但是,监
对英语学习者而言,进行大量阅读是精通英语的重要条件(黄源深,2006)。因此,阅读教学在英语教学中的地位不容忽视。反观,在现阶段的高中英语阅读教学中,教师和学生只将阅读学习重点放在了校园中的课堂上,课外阅读没有得到应有的重视。“文学圈”作为一种阅读模式,已被国外广泛应用至课堂语言教学与课外阅读教学之中。该模式有利于自然地将听说读写四大技能结合,从而提高学习者的阅读水平。本研究以输入假说、人文主义教
模块化外转子磁通切换电机(Modular Outer-Rotor Flux-Switching PermanentMagnet Motor,MOR-FSPM)同时综合了三类电机的优点:模块化电机、外转子电机、磁通切换电机。模块化
“强索”一词并非严格意义上的法律概念,而是社会学上概念。通说认为,未成年人“强索”行为指的是未成年人为追求物质上和心理上的刺激,多以团伙形式组成的以大欺小、恃强凌弱,采用威胁或暴力手段,公开索取他人财物的行为。最近几年,我国未成年人犯罪数量、未成年罪犯占刑事罪犯总数的比例在逐年下降,可未成年人财产性犯罪却一直处于高运行状态。这其中就包括了未成年人“强索”类行为犯罪。贵阳市花溪区位于贵州省贵阳市南部
计算机断层成像(CT)作为一种重要的检测技术,能利用多个投影角度下的投影数据重建出物体内部和外部结构特征的二维或三维图像。它以无损、高精度等特点广泛的应用建筑物裂隙
随着遥感技术的快速发展,获取的遥感数据越来越丰富。因此,通过遥感图像处理的手段从这些数据中及时、准确地获取所需信息,并推动它们在各领域的应用是当前需要解决的实际问题。多源遥感图像融合与遥感图像分类是遥感图像处理中重要的两项任务。其中,多源遥感图像融合通过对不同来源的遥感图像进行优势互补,提高遥感图像的信息表达,为遥感图像的分类奠定了基础。而遥感图像分类作为遥感图像处理的高级阶段,通过对遥感图像场景
积极的财税政策是调控宏观经济的重要手段,在我国当前经济新常态的背景下,研究如何发挥财税政策的“逆周期”调节作用,通过采取哪些税种以及何种减税力度的政策组合挖掘并释放我国居民的消费潜力,推动居民消费升级,同时刺激生产供给侧的高新技术产业发展提升供给质量和改善产业结构,进而推动供给侧和需求侧的协同演化和共同升级,以此促进中国经济的高质量增长是具有重要的现实意义。本文详细介绍了当前我国经济发展过程中居民
曾经“半导体”一词对非从业者而言显得十分陌生,而随着“中兴事件”的爆发,“集成电路”、“芯片”、“半导体”等关键词不断进入人们的视野。所谓“中兴事件”是指美国商务部于2018年4月16日宣布:未来7年内,美国公司不再向中兴通讯出售任何技术和设备。由于技术落后,在中高端芯片领域,我国极度依赖美国进口,很难找到可以替代的方案,如果此禁令被执行,中兴通讯的业务及发展在未来几年内将遭受重大打击。正是这一纸
随着交通运输业的迅速扩展,公路交通量和载重量均在不断增长,车辆超载问题日益严重,危及既有桥梁的运营安全。本文基于高速公路WIM实测车辆数据,研究了不同跨径简支梁桥在随机车流作用下的荷载效应极值,并与设计荷载规范进行了对比;引入交通量区间增长模型,预测了交通量增长下简支梁的荷载效应极值,分析了交通量增长对中小跨桥梁荷载效应极值的影响;基于实测车流数据,提出了考虑车桥耦合振动的桥梁车载动力效应极值外推
对贝叶斯网络进行学习是一个NP难问题。当数据集比较大时,贝叶斯网络的节点数和边数会变得错种复杂,紧紧依靠专家去构建贝叶斯网络将十分消耗人力,并且会遗漏一些关键的关系