论文部分内容阅读
科学技术的快速发展和社会形态的快速变化,使得人们对公共安全的重视程度越来越高。大量的视频监控设备安放在人流密集的公共场所,这对于刑事案件侦破、失踪人口追踪、城市治安管理起着重要作用。行人重识别作为视频分析的重要技术手段,旨在从不同视域下检索并匹配检测目标是否为同一行人。现实场景中,由于受到拍摄角度、光照、遮挡、背景等因素影响,拍摄的行人图像也千差万别,因此行人重识别的研究具有很大的挑战性。目前行人重识别的研究主要从两个思路展开:一是提取具有判别力和鲁棒性的深度特征对图像进行表征,二是设计合理有效的距离度量函数对深度特征进行辨别。本文同时从这两方面着手,并结合深度学习技术来设计有效的行人重识别算法。为了完整地刻画行人图像,本文设计了基于注意力和属性学习的行人重识别算法模型(SJ-AAN),该模型为双分支结构,能够从不同层面对行人图像进行表征。主要归纳为两个方面:(1)基于全局的深度注意力特征,本文通过将注意力机制融入到深度卷积神经网络中,构成网络的注意力分支,注意力分支通过模型迭代更新,自适应地关注图片中行人所在的显著性区域,从而有效降低背景、光照等因素带来的噪声;(2)基于局部的语义属性特征,属性特征包含图像的语义信息,在行人外观和姿态发生变化时表现出较高的鲁棒性,因此本文利用深度残差网络提取图像的属性特征,从而捕获行人特征的语义不变性。为了在特征空间中提取不同分支的深度特征,本文分别设计了注意力损失和属性损失函数。具体而言,注意力损失函数使得在特征空间中,聚合表示同一行人的特征点,而分散不同行人的特征点;属性损失函数使得拥有更多相似属性的行人判别为同一个人的概率更大,拥有较少相似属性的行人判别为同一个人的概率更小。目前大多数行人重识别文献在特征融合上常常采用级联的方式,而忽略特征之间的关联性,针对于不同分支的特征,本文设计了基于双线性特征嵌入的行人重识别算法(BEN),以捕获不同特征之间的对应关系。双线性特征嵌入主要包含双线性特征聚合和空间池化嵌入两个部分,双线性特征聚合首先通过仿射变换获得特征的紧凑性表达,然后通过外积的方式聚合注意力特征和属性特征,最后通过空间池化形成融合特征,从而大幅度提高行人重识别的效果。当前行人重识别网络的训练依赖于大量标记数据,这严重限制了行人重识别在实际应用中的可扩展性。对此本文提出属性关联学习策略对网络模型进行分步优化,网络将属性分支的预测结果作为“软标签”嵌入注意力分支中,帮助注意力分支迭代训练,从而进行无监督行人重识别。最后,为了验证所提出算法的有效性,本文在两个标准数据库:Market-1501和DukeMTMC-reID上进行实验。实验结果表明,本文提出的算法能够显著提高行人重识别的准确度。