论文部分内容阅读
近年来,随着智能视频监控、车辆辅助驾驶和人体行为分析等领域的广泛应用,行人检测技术已经成为了计算机视觉重要的研究课题。传统的检测方法虽然能够满足速度要求,但精度相差较远,基于卷积神经网络的方法精度较高,但检测速度慢。本文针对基于卷积神经网络的行人检测方法中出现的问题进行研究,在前人的基础上,从行人检测的多尺度、多遮挡以及实时性三个方面提出改进方法。本文主要的研究成果可分为以下三个方面:(1)针对车辆辅助驾驶系统在拍摄过程中行人不同的长宽比造成的多尺度问题,本文提出一种基于改进全卷积网络的多尺度感知行人检测方法。首先,通过在全卷积网络结构中引进可形变卷积层,扩大特征图的感受野;其次,通过级联RPN提取多尺度行人建议区域,引入多尺度判别策略,定义尺度判别层,判别行人建议区域的尺度类别;最后构建一个多尺度感知网络,引进Soft-NMS检测算法,融合每个网络输出的分类值和回归值,获取最终的行人检测结果。实验可得,本文的检测算法在基准数据集Caltech和ETH上产生较低的检测误差,优于当前数据集中所有检测算法的精度,并适用于检测远尺度的行人。(2)本文在研究多尺度行人检测的基础上,针对算法检测多遮挡行人精度低和速度慢的问题,提出了一种基于改进R-FCN的多遮挡行人实时检测算法。在R-FCN网络基础上,引进感兴趣区域(RoI)对齐层,解决特征图与原始图像上的RoI不对准问题;改进可分离卷积层,降低R-FCN的位置敏感分数图维度,提高检测速度。针对行人多遮挡问题,提出多尺度上下文算法,自适应输出不同尺度的行人RoIs;针对遮挡部位可见度低,提出可形变RoI池化层,扩大对身体部位的池化面积。为了减少视频序列中行人的冗余信息,使用序列非极大值抑制算法代替传统的非极大值抑制算法。检测算法在基准数据集Caltech训练检测和ETH上产生较低的检测误差,适用于检测多遮挡的行人。(3)针对检测模型参数量过大,算法在嵌入式系统无法达到实时检测的问题,提出了一种基于通道裁剪的方法实现模型压缩加速的方法。首先,使用通道选择和特征图重构的方式来最小化输出特征图的重构误差。然后,为了提高中间层通道的参数判别力,引进判别感知损失函数,自适应地移除中间层中不重要的参数,减少模型的冗余度。最后采用“训练-裁剪-微调”的三段式加速方法在尽量保证检测精度的同时降低总的测试时间。本文通过比较裁剪比例和算法的运算时间,在保证不损失检测精度的前提下,缩小了训练模型的参数量,将算法应用到嵌入式系统中,达到了实时检测速度。