论文部分内容阅读
利用三维激光扫描仪能够获取三维点云数据,点云数据具有高密度、高精度等特点,因此,在对复杂真实的三维场景进行目标检测时,包含丰富属性信息的三维点云是当前三维目标检测的重要数据基础。目前计算机视觉领域的研究热点之一是目标检测任务,主要分为两个任务:在输入数据中框出目标物体的边界框,同时判断边界框中的物体的所属类别。二维目标检测技术已经在主流的公开数据集上取得不俗的成绩,但在图像上进行的二维目标检测缺少空间信息,很难将其扩展到三维的目标检测,对于复杂场景和较小物体的鲁棒性较差,无法满足自动驾驶等高层次检测任务的需求,因此如何建立一个高效智能化且能够直接利用三维点云数据进行目标检测的三维目标检测模型具有重要研究意义。本文利用端到端的Frustum-Pointnets点云深度学习模型实现三维目标检测,并对模型进行改进和优化,进一步提高Frustum-Pointnets模型检测的准确率。本文的主要内容包括:(1)对主流的目标检测算法的总结对比。传统的目标检测算法非常依赖人工提取特征的精度,针对这个问题,对目前利用深度学习网络实现的目标检测算法进行对比分析,根据输入数据的不同可以分为:利用图像的目标检测算法、利用多视角投影的目标检测算、利用体素的目标检测算法以及利用原始点云的目标检测算法,同时简单地讲述了具有代表性的算法的实现过程。(2)对基于深度学习网络的目标检测算法相关理论的总结归纳。对卷积神经网络内部的各个组成部分及其作用进行分析,卷积神经网络主要由卷积层、池化层、全连接层以及分类器组成。(3)Frustum-Pointnets模型的构建及其改进和优化。当前的目标检测算法大都在图像上实现二维目标检测,也有将点云转换为多视角图像或体素等其他数据形式来实现三维目标检测,然而存在着很大的局限性。为了可以直接利用原始点云数据,避免转换数据形式带来的特征丢失,本文将利用Frustum-Pointnets模型来实现利用原始点云的三维目标检测,同时改变不同的激活函数和参数初始化方法来进一步提高该模型的检测准确率。最后在公开的大型真实交通场景KITTI数据集进行训练和验证,最终的实验结果表明改进后的Frustum-Pointnets模型的检测效果有了很好的提升。