多模态融合感知技术研究与设计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:chen_chen1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶技术作为未来产业升级的关键技术,其中面向交通场景下的目标识别任务近年来得到广泛的研究。目前,智能汽车依靠多种传感器获取的数据来感知周围的环境信息,这为系统提供了决策依据。经过预处理的不同的传感器数据可视作一种输入到自动驾驶感知系统的信息模态,并且同一种传感器的数据经过不同的预处理都可以视为不同的数据模态。如何有效地将多模态数据在深度学习网络框架下进行融合是当前国内外的研究热点。单一的传感器在特定场景下目标识别结果的可靠性不足,目前已经商用的自动驾驶汽车普遍安装了多个传感器用于感知周边环境。不同类型传感器的数据是异构的,因此在多模态数据融合过程中需要对不同模态的特征提取网络进行单独设计。此外,不同模态数据包含的环境信息量存在差异,多模态信息的融合过程需要解决多模态数据之间的信息不对称并且融入多种数据模态的相关性。针对上述问题,本文主要研究激光雷达(Light Detection and Ranging,Li DAR)点云和彩色(Red-Green-Blue,RGB)图像融合,采用端到端神经网络结构,用于行人和车辆的识别。本文主要创新如下:1.利用相机-激光雷达联合标定原理将三维的激光点云数据模态转换为二维的深度图。通过不同数据模态的转换,实现了激光点云中的环境信息和RGB图像中的环境信息的时空同步,解决了异构模态数据之间融合困难的问题。2.提出了一种数据填充算法,将映射后稀疏的激光点云深度图片转换为稠密的点云深度图片,其中引入了邻域填充的思想,将稀疏的点云信息转换为稠密的点云信息,提升了Li DAR数据模态在输入神经网络后的空间特征显著性。3.以YOLOv3(You Only Look Once version 3)算法为基准网络实现了多模态数据的早期、中期和后期融合策略,同时提出了一种多尺度的多模态数据融合方法,该方法引入了一个辅助网络来学习多模态数据的相关性。此外,本文在同一个验证数据集上对比和验证了不同融合方法的目标识别精度。本文所提出的方法在开源数据集(Karlsruhe Institute of Technology and Toyota Technological Institute,KITTI)的二维目标识别数据集上面进行训练、测试和验证。实验结果表明,本文提出的中期融合策略相比于其他融合策略,具有更好的目标识别精度和效果。
其他文献
2018年,开放媒体联盟推出AV1新一代视频编码标准,推动视频编码技术向前发展与落地应用。然而,在实际应用中,H.264标准依然占有很大的市场,X264是优秀的H.264标准编码器。在视频编解码技术中,率失真优化技术在提升视频编码的效率上发挥了关键作用,但是现有编码器的率失真优化技术更多的是考虑当前编码块编码模式的选优,并没有考虑对后续编码块编码模式的影响,求解率失真优化问题时没有充分考虑时域依赖
改革开放以来,我国服装业发展迅速,目前已经成为世界上首当其冲的出口大国,服装行业体量巨大,是贸易全球化发展中的翘楚。但数量和速度不断提升的同时,我国服装企业和发达国家相比,在设备、技术以及品牌方面依旧存在问题和不足,既面临来自国外品牌的冲击,又有劳动力、能源等要素成本持续上涨的压力,产业升级和经营转型成为企业可持续发展的必然方向;而企业的并购行为可以有效整合品牌优势资源,对于服装企业来说是持续保持
本文以设计管理相关理论为指导,研究建构设计语言体系对文创产品创新设计的指导方法,以敦煌文化为切入点,通过构建敦煌文创产品的设计语言规范指导敦煌品牌文化产品设计基因的一致性,以此达到管理品牌形象的目的。帮助文化创意品牌更好地提升品牌感、品牌价值,系统地进行品牌传播,增强用户忠诚度。本文分为三部分进行研究。第一部分重点梳理了文化创意产业的概念、发展并对故宫文创、台北故宫文创、大英博物馆文创三个品牌进行
里姆斯基-科萨科夫是浪漫主义时期俄罗斯民族主义乐派的代表人物之一,本文选取了他的著名歌剧《沙皇的新娘》中女主角之一柳芭莎,以其音乐形象塑造为研究对象,在借鉴前人研究成果的基础上,用唱段研究的方法,对人物的音乐形象塑造进行深入地解读和分析,从中发掘里姆斯基-科萨科夫歌剧中次女高音作品的演唱风格。通过研究使声乐学习者能够更好从歌剧故事剧情的角度出发,把握人物情感,刻画人物内心,认识到《沙皇的新娘》的音
陶行知先生说:"过的是少爷的生活,虽天天读劳动的书籍,不算是受着劳动教育。"这说明了学校要社会化、教育要生活化、生活即教育的道理。那如何将生活带入幼儿教育中,如何赋予生活教育意义?这需要教师的智慧,需要教师的引导。劳动教育的重要性实践证明:劳动创造了世界,也创造了人类本身。我们的祖先、我们自己、我们的后代的生存都离不开劳动。
期刊
军营、重要机关、交通枢纽等社会重点场所有着安检和场景监控需求。通过人工的方式对图像画面和人员进行筛检,往往有较高的成本;在对特殊人员的检查时易带来诸多不便。无源探测成像依靠场景内辐射的电磁波进行成像,有较好的安全性和隐私保密性。毫米波、太赫兹频段电磁波对常见遮蔽物有较好的穿透特性。基于新型安检、监控设备,通过目标定位及跟踪算法,实现对大场景下流动人员的安防布控。本论文依托实际科研项目,开展了毫米波
设Rn+p(c)是(n + p)维空间形式,M是Rn+p(c)中的紧致无边的n维子流形,x : M→Rn+p(c)是等距浸入。设r是偶数,且r∈{2,...,n - 1} ,我们称M是广义r-极小的,如果存在常数λ,使得(r + 1)Sr+1 +λS1≡0。同时,我们构造一类泛函Ar(x) =∫mFr(S0,S2,...,Sr)dV的保面积变分,计算其第一变分公式,得出x是保面积变分之临界点当且仅
图像语义分割技术作为无人驾驶汽车感知环境的手段之一,近年来随着深度学习的发展取得了巨大的进步。该技术本质上是一个像素层级的密集预测任务,往往存在容易消耗大量的计算资源,难以达到实时应用等问题。针对上述问题本文完成了以下三方面的工作:首先设计了两种轻量级的快速残差基本模块,并从参数量、感受野以及不同尺寸卷积核的相对占比率的角度分析了两种基本模块的优势。然后基于两种基本模块,构建了具有更少参数量的轻量
随着2018年国家正式把乡村振兴列为我国的重大发展战略,乡村振兴近几年逐渐成为人们讨论的热点和焦点话题。与此同时,乡村振兴的各项建设也在不断推进和落实。此外,中国的城镇化建设也带动了乡村热潮的兴起。如何开辟出一条具有创新性、可持续发展的乡村振兴,越来越成为国家和地方共同关注的课题。乡村旅游作为乡村经济发展的重要一环,在经济拉动力上起着不可或缺的作用。因此,重视乡村旅游业的发展已然成为当下乡村振兴背
针对航母编队探潜能力评估问题,提出结合声呐方程和海洋声学模型的探潜成功率计算模型,该模型结合了主被动声呐方程、Medwin公式、Bellhop射线模型、Wenz海洋环境噪声谱等海洋声学模型,充分考虑海洋环境因素,以概率等高线图和有效覆盖区域的方式呈现了编队探潜能力,最后,对结果进行了分析总结,并给出航母编队探潜的建议。