论文部分内容阅读
行人再识别技术是智能监控系统中重要的组成部分,其目的是在非重叠的摄像机采集区域,识别特定的行人身份,现已成为计算机视觉领域一项热门研究课题。本文在国内外研究的基础上,结合对特定场景和方法的理解,以提高行人特征的表示能力和判决能力为切入点,对传统方法中字典学习方法在行人再识别的应用进行了深入研究,随着深度学习方法在行人再识别领域的广泛应用,后期工作也对基于深度学习的再识别方法进行了初步探索。本文的主要贡献和创新点如下:(1)考虑跨视角行人的关联,提出了两种基于半耦合判决字典学习的行人再识别方法。第一种为耦合解析-合成字典学习方法,在半耦合字典学习中引入解析字典,避免了l0或l1范数带来的计算损耗,并构造一个关联函数,以描述不同视角间行人特征的相互表示特性,提高合成字典的表示能力;第二种为松弛标签空间转换的半耦合字典学习方法,利用一个非负矩阵构造能够区分不同类样本的松弛标签空间,并利用一对映射矩阵将编码系数映射至松弛标签空间,在保证相同行人编码系数一致的同时,扩大不同行人编码系数之间的距离,从而提高模型的类间判决能力。此外,两种方法的数据预处理采用了局部费舍判决分析。在公开数据集上的实验结果表明,本文所提出的两种方法均具有较好的鉴别力,能够有效地提升行人再识别性能。(2)考虑行人特征空间的几何特性,提出了一种基于图正则化和标签匹配字典学习的行人再识别方法。本文首先在单一字典学习模型中构造图正则化项,使得学到的编码系数空间能够保留原始特征空间的局部几何结构。然后构造了一个标签匹配项,进一步约束相同行人的编码系数,保证其更加紧密地聚集在一起。在公开数据集上的实验结果表明,与其他方法相比,本文所提出的方法能够取得更优的行人再识别性能。(3)考虑行人局部身体结构之间的联系,提出了一个基于多尺度局部区域和多层注意力的行人再识别网络。本文首先构造了多尺度局部区域分支,利用池化和竖直分割操作得到行人图像不同空域尺度的局部特征,从而以局部到全局的方式逐步获取不同区域的身体结构信息。然后构造了多层注意力分支,提取不同卷积层的注意力特征图,从而在不同的语义信息下捕获行人图像的判决区域。最后级联两个分支的特征向量,得到更加鲁棒的特征表示。在多个大规模数据集上的实验结果表明,与其他同类深度学习方法相比,本文所提出的方法能够取得更优的行人再识别性能。