论文部分内容阅读
近年来,人工智能技术正在以高速发展的趋势,渗透于我们生活的方方面面,从无人驾驶到刷脸线上支付,从视频处理到语音处理,随处可见的都是人工智能的应用。尤其现在随着大众生活水平的提高,人们对产品的便捷要求、质量要求、舒适度要求以及安全性要求也越来越高,这一点在无人驾驶智能汽车上表现的尤其明显。而目前对无人驾驶汽车的最大的现实需求就是使其能够快速有效安全的感知道路上的行使车辆,因此对基于视觉的道路车辆感知方法进行研究是很有现实意义和作用的,而在基于视觉的道路感知方法研究中,目标检测算法占据着极其重要的位置,但在传统的道路车辆检测方法中,都是2D目标检测,但在实际的环境下,道路上的车辆都是呈现3维立体形态的,仅仅使用2D目标检测,已经无法满足无人驾驶技术的快速发展,并且2D目标检测的在检测精度上的表现也不如3D目标检测。在3D目标车辆检测中,很多前沿的研究者们都是结合深度学习网络以及雷达点云数据,因为深度学习网络具有很强的自学习性和优秀的鲁棒性,而雷达点云数据则能很好的提供目标的深度信息,有助于目标的回归。然而由于雷达点云数据存在这稀疏性和不规则性的缺点,使得在3D目标检测中仅仅使用雷达点云数据,在目标车辆的定位效果和鲁棒性的表现上都存在着巨大的挑战。针对上述问题,本文在充分研究现有3D目标检测方法的基础上,提出了一系列的改进思想,设计出了新的3D目标检测方法,并通过实验验证了改进后算法的可行性。本文主要研究内容及贡献包括:(1)首先介绍了传统的基于手工特征的目标检测方法,然后介绍了深度学习中有关目标检测方面的相关基础知识,然后介绍了两种基于深度学习的2D目标检测算法,分别是一阶段的YOLO算法和二阶段的Faster R-CNN算法。最后重点介绍了一种基于纯雷达点云数据的3D目标检测方法。(2)分析在稀疏嵌入式卷积检测算法(简称SECOND)中加入卷积块注意力模型(简称CBAM)的可能性,并设计了一种基于CBAM模型改进的3D目标检测方法,CBAM注意力模型中又分为通道注意力(Channel Attention,简称CA)和空间注意力(Spatial Attention,简称SA),CBAM注意力模型是将CA和SA串联起来进行处理,除此之外本文做了很多额外的对比实验比如单个CA、单个SA、并联CA和SA进行处理。(3)最后本文提出了一种新的多尺度雷达点云体素划分方法,将雷达点云数据在多个尺度下进行体素划分,然后将不同尺度下的体素网格通过特征提起网络进行特征提取,最后将各个尺度下的特征级联在一起输送到后续的网络,本方法解决了在单一尺度体素划分下,某特定场景下目标信息无法得到充分利用的问题。