论文部分内容阅读
随着科技的发展,人工智能时代的到来,各行各业都掀起了一股人工智能的浪潮,在智能交通体系,如何对交通环境中的行人进行检测成为了主要关注的焦点。由于交通环境比较复杂,每个人在严格意义上都是交通的参与者,每天都以不同的形式参与交通,交通安全就是道路上每个人的生命安全,所以对于道路上的行人检测在算法的检测精度与速度都有一定要求。传统行人检测方法虽然速度上可以达到某些要求,但是若论检测精度还是有诸多不足。随着对行人检测的深入研究,对于行人检测的数据集,通过不断的补充和优化在数量与质量上都有很大的提高。而虽然基于卷积神经网络的新方法在精度上提高较大,但其面临的新问题是,随着需要数据的增多其所需的计算量也随之增大,当前环境下多显卡并行运算的发展,在一定程度上缓解了这个问题。首先,本文对行人检测中的诸多问题和因素进行了介绍,比如说行人检测的公共数据集、特征提取方法以及分类器的选择方法,除此之外还有可以替代传统金字塔滑动窗口方法的区域推荐方法和用于减少重叠检测框的非极大值抑制算法(NMS)等。而且通过具体的研究发现目标检测与目标分割的关系是非常紧密的,它们之间可以实现互相优化,也就是说可以在检测中融入分割的思想以提高效率。其次,使用Mask RCNN通用目标检测框架对图像进行检测,在文中详细介绍了基于Mask RCNN构建的行人检测网络的设计方法,如特征提取网络、区域推荐网络、候选窗口分类与分割网络,并用MS COCO数据集训练该网络,在最新的行人检测数据集Cityscapes数据集上进行了测试。实验结果表明该方法可以实现高效精准的行人检测。针对行人小目标漏检的问题进行系统的分析,初步验证了数据集中目标尺度的分布情况会影响模型针对不同尺度目标的检测性能,但改变数据集的整体分布又是较为困难的,因此调整输入图像分辨率,进而影响测试集中目标尺度分布情况,解决小目标漏检的问题。结合Mask RCNN目标分割准确度加高的优点,设计一种优化算法,对车内司机与乘客误检为行人的情况进行修正处理。最后,利用特征融合方法,使Mask RCN结合图像分割特征,其中图像分割网络采用DeepLabv3图像分割网络,在融合图像分割网络后,其中等目标和大目标的准确度有提高。