自主无人系统交通场景高效语义分割方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:txiujykyu6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的高速发展,各主要经济体相继出台了促进人工智能发展的国家级战略规划。作为我国人工智能发展规划中重要组成部分,自主无人系统(如无人驾驶、移动机器人等)因此受到了企业与高校的广泛关注。为满足自主无人系统的场景理解需求,旨在为像素提供类别标记(如汽车、交通灯)的语义分割随之成为研究热点。近年来,深度学习的快速发展极大提升了语义分割的精度,然而,得益于实验平台丰富的计算资源,大部分高精度模型忽略了模型效率,因此难以应用于以嵌入式平台为主的自主无人终端。为此,针对自主无人驾驶场景理解需求,本文重点研究面向实际应用的高效语义分割模型,本文主要创新与贡献如下。
  深入分析了深度网络计算耗费来源,发现深度网络计算耗费大部分来源于其宽度(即特征通道),因此提出了实时网络宜窄且深的设计理念;此外,鉴于传统卷积运算耗费基数过大,引入分通道独立卷积设计了新型基础卷积模块,并结合上述宜窄且深的实时网络设计理念,构建了适用于语义分割的实时特征提取网络NarrowwhileDeepNetwork45(NDNet45)。相比经典网络ResNet18,在保持分割性能可比的前提下,NDNet45参数量缩减约18倍,浮点运算量缩减约37倍,大大提高了语义分割效率。
  提出了基于模型与数据驱动的实时语义分割方案。在模型上,利用全卷积网络FCN8架构平均特征分辨率低的优点,提出了预测自适应融合的改进FCN8框架,在仅引入少量额外计算耗费的前提下,实现了模型性能的提升;在数据上,针对小目标对交通场景理解的重要性而现有实时模型小目标分割精度偏低的问题,深入分析了交通场景图像的特点,发现交通场景样本分布不均衡,且呈现小目标少大目标多的特点,为此,提出了面向交通场景的小目标数据增广方案,该方案核心思想在于:以不遮挡其它目标为前提,增加原始训练图像中的小目标数量。通过应用上述方案至NDNet,本文实时语义分割在Cityscapes测试集上取得了65.7%mIoU的分割精度,且在1024×2048高分辨率图像上浮点运算量仅需8.4G,优于多数实时模型。
  基于深度学习的语义分割涉及低分辨率特征至高分辨率语义预测的上采样过程,因此,尽管降低输入分辨率可有效提升语义分割效率,但同时将增加后续上采样的倍率,从而给空间细节的恢复带来极大挑战。为此,本文通过将传统双线性插值转换为多次分通道卷积,实现了参数可学习的上采样,从而减少了输入分辨率降低对精度的负面影响,进一步提升语义分割效率。通过应用本文学习上采样,高精度模型DeepLabV2分割精度可提升约1.2个百分点,且效率基本保持不变。
  尽管现有实时模型大大提升了语义分割效率,但其精度仍与高精度模型相距甚远。另一方面,当语义分割精度较低时,引入条件随机场(Conditional Random Fields: CRF)对语义分割进行优化成为一种常用手段。然而,由于CRF复杂的图优化过程,导致其效率十分低下,因此难以应用于实时语义分割模型。针对此,本文在深入分析CRF的原理的基础上,将CRF的核心思想简化为“像素标签不仅与其自身特征相关还与其邻居特征相关”,以此为基础,提出了局部共享特征以替代CRF模型。实验表明,局部共享特征通过邻居将特征共享实现了局部依赖的建模,可有效改善语义分割标签的平滑性与连续性。
  综上所述,针对现有高精度语义分割难以满足自主无人驾驶的快速场景理解需求,本文从模型上设计了实时特征提取网络以及实时语义分割框架,有效提升了语义分割效率,在此基础上,进一步提出了学习上采样、局部共享特征以及基于合成数据的数据增广等精度改善方案,在仅引入少量计算耗费的基础上提升了语义分割精度。
其他文献
偶然得知大名鼎鼎的王太家在朝外soho开了榴莲主题店,便抱着很大期待前去拜访。  这家新店选在一处相对清静的位置,比簋街老店宽敞很多,仍旧延续一种温馨又大气的调调。进门处定制了一台玻璃橱窗,众多经典产品摆设其中,痴痴地看着它们像旋转木马一般,很是梦幻,接下来的榴莲甜品更是超出了我的期待。  榴莲最心卷:一款为七夕节打造的榴莲点心,造型自然是相当梦幻。中间的桃心部分用覆盆子打造,慕斯部分则用猫山王榴
期刊
如果早上只给你30分钟的时间,你是会打造一副精致完美的妆容,还是做一顿美味可口的早餐?很多上班族可能会选择前者,然而身体才不会在乎你的脸蛋上到底涂了几千块还是几十块的精华,记住填饱肚子比什么都重要。多花点时间考虑一下你的早餐吧,工欲善其事,必先利其器。  这些小家电会帮你快速成为早餐达人,让你事半功倍。  中式早餐 黄金组合  豆浆加油条的组合绝对可以排到中国人最喜爱早餐的TOP3之列,金黄酥脆的
期刊
AileenGift  简介:AileenGift是一个正在成长中的设计师品牌,专业的设计师充满敬业精神,善于跨越时间、地域、文化,呈现富有美感的混搭与兼容,倾心传授关于花艺的知识和最新流行的设计思想。  特色课程:永生花DIY沙龙  价格:350元/人  永生花是用高科技手段,将鲜花经过脱水、保色、干燥等复杂程序加工而成。它的色泽、形状、手感与鲜花无异,只是可以更长久地陪伴(约3年)。永生花di
期刊
世界上最古老的酒  黄酒古来是中华特产,属酿造粮食酒。与啤酒、葡萄酒并称世界三大古酒。约在三千多年前的商周时代,中华先民就独创酒曲复式发酵法,开始大量酿制。黄酒以大米、黍米为原料,一般酒精含量为14%—20%,属于低度酿造酒,易上口,不伤身。因原料丰富又温润柔和,黄酒产地较广,品种很多,现在中国许多省份都能找到当地特产的黄酒。而几个产销大省,又有细分,其中浙派黄酒以浙江绍兴黄酒为代表(除去绍兴产的
期刊
更加小巧,更加真实  我们能轻易地通过声音辨别最熟悉的人,辨别是人类与生俱来的能力。当然,你在听音乐的时候若能鉴别出几分细腻,恰恰是细腻才能最直接地触动内心真实的自己。在这声质方面,扬声器是把可听范围内的音频电功率信号通过换能器,把它转变为具有足够声压级的可听声音。在还原音质方面,无疑BeoLab 20更加出色,BeoLab 20高端无线扬声器采用极简线条设计,更加小巧的体积却蕴含无比澎湃的音乐能
期刊
或繁或简,吊灯在屋顶领域称王称霸。吊灯通常非单支,犹如星星一样,带点儿不一样的浪漫,通常落户在客厅及餐厅,装饰着我们的小小领空。吊灯式样要参考房间高度,更要匹配家居风格。  无论是书房的台灯还是卧室的台灯,它更多属于我们的私人时间,静守着我们独处的时光,带给我们恒定的光和亮。某种程度上,台灯犹如我们的贴心知己。同为贴心知己,它也可以有不同的面孔和风格哦。  落地灯虽然相较吊灯、台灯等略占据地方,但
期刊
编织室外吊灯  这款室外吊灯灵感来自地中海上的捕鱼器,最后造型像天上柔软的白云以及浪花泡沫。将定制的金属网捕鱼器与手工织物结合在一起,成就了这款灯光柔和温馨,很有夏季海滨温馨气息的吊灯。  三种尺寸,黑色或金色,可折叠,易于安装。  蚕茧灯  可以放在桌上,也可以挂起来的蚕茧灯采用了黑色,白色,灰色的感光树脂。白色部分非常坚硬,提供了刚性承载,具有良好的漫反射性。黑色部分是用于勾勒表面,提供色彩对
期刊
结构光三维重构技术是一种非接触式的光学测量手段,利用被测物的一组结构光图像,能高效准确地计算出无纹理被测物的表面三维形貌和所处的空间位置,能广泛应用于工业检测、生物医疗、数字化建模等领域。本文基于普通正弦条纹结构光,采用集中型高频编码策略,将伽马系数融入结构光编码公式中,提出了一种由变形正弦条纹组成的高抗性结构光。高抗性结构光可以利用系统非线性在照片中恢复自身的正弦性,并能有效抵御环境因素的干扰,
移动机器人定位技术是实现导航任务的关键条件,其目的在于确定机器人在全局地图中的准确位置以实现精确的位姿跟踪。全局自定位过程需要在完整的场景空间中进行位姿搜索,计算量极大并且定位过程中潜在的场景二义性、局部场景动态变化等问题将导致先验数据关联失效,从而造成定位精度下降甚至全局定位失败。二维图像匹配定位技术可以快速确定机器人的全局位姿,但位姿估计精度不高,通常应用于视觉初定位阶段;三维点云配准定位技术充分利用了环境结构信息,可获取高精度的机器人位姿,通常应用于精定位阶段。综合考虑,本文结合两种定位技术提出了一
水泥工业是国民经济的基石产业,提高水泥熟料烧结过程的信息化和自动化水平是提高产品质量、降低能源消耗的重要途径。但是,熟料烧结过程属于典型的非线性动态过程,具有大时滞、强耦合等特点,且处于高温、多粉尘的封闭回转窑内。在这样复杂恶劣的环境下,难以用传感器直接测量熟料烧结过程信息,成为水泥生产自动控制理论与技术面临的瓶颈问题。
  针对以上问题,本文依托国家自然科学基金项目,综合运用水泥熟料烧结过程的机理知识及数据,深入研究熟料质量(游离氧化钙含量)、窑体热损失、窑内物料料层高度等重要过程信息的软测量方法