论文部分内容阅读
多目标追踪问题一直是计算机视觉研究的基础问题,为后续其他视觉任务提供支持。目前很多的多目标追踪以行人,车辆等为追踪对象,针对人脸的目标追踪研究相对稀少。本文针对南京地铁站入站口的安检监控视频,以人脸作为目标检测基础,提出了基于多特征融合的多目标追踪算法。本文主要工作如下:1、本文根据MTCNN人脸检测网络进行改进,提出了一种更加快速有效的人脸检测方法。为了解决在原网络结构上训练收敛缓慢问题,该方法在网络结构上引入更容易训练的Batch Norm结构在训练过程中对数据进行归一化,同时该方法根据实际情况,删除了原MTCNN网络中的回归特征点,进而提升前向速度。由于原MTCNN网络采用平方差损失函数,使得训练样本对于与真值相距较远的点收敛缓慢,该方法采用一阶损失函数,避免这个问题。在网络训练上,该方法采用蒸馏网络和目标阶梯检测方法,对网络进行进一步地压缩和性能提升。经过FDDB数据集评测,该方法在WIDER FACE数据集上的训练结果,对比同样在WIDER FACE数据集上训练的原MTCNN网络结果有8%的提升,并且平均速度达到30FPS,证明该方法可以快速准确地对人脸进行检测。2、基于改进的MTCNN人脸检测方法,本文提出了基于多特征融合的多目标追踪算法。对比传统手工特征,为了能更好地应对目标尺度变化,目标遮挡,变形旋转等不利条件,本文将MTCNN网络中的卷积特征做为表观特征,并融合卡尔曼滤波器得到状态特征和位置尺度特征作为融合特征进行数据匹配。同时,结合实际视频情况,提出了一种基于条件判断的数据匹配方法,分别针对连续追踪,追踪中断和目标重叠三种情况进行多目标追踪。实验证明,在实际检测过程中该方法对比采用单一特征以及一般数据匹配方法的多目标追踪算法有明显提升。3、设计了一款基于C++的多目标追踪的安防监控系统。该系统主要包含动态检索模块,检索查询模块,资源管理模块,参数管理模块,完成对地铁安检监控的查询检索、追踪统计功能。同时该系统拥有C/S和B/S两种架构,能够满足不同用户的多种需求。