基于深度度量学习的行人再识别方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:tambourine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是计算机视觉领域的一项重要研究方向。行人再识别(Person Re-identification,Re ID)是图像检索的子领域,是利用计算机视觉技术判断不同摄像头视角下是否存在特定行人的技术。行人再识别在刑侦、安防、失踪人员查找等领域具有较大的应用前景,逐渐成为计算机视觉领域的研究热点。本文对行人再识别中的深度度量损失函数进行了深入研究,设计了统一样本对损失与分类损失的新的损失函数,同时提出了基于注意力机制的行人再识别网络。本文主要贡献如下:(1)针对多任务损失函数梯度方向不一致问题,推导出统一分类损失函数与样本对损失函数的深度度量损失函数形式。新损失函数形式能有效解决难例挖掘问题、梯度爆炸问题以及正负样本对权重分配问题。实验表明,损失函数形式在一定程度上提高行人再识别模型性能。(2)为统一余弦距离和欧式距离,设计了一种同时优化向量距离与夹角的极坐标映射距离(polar project distance);为减少手动搜索超参数所带来的时间损耗,构建了一种自动学习损失函数超参数的阈值自适应模块;结合极坐标映射距离、阈值自适应模块以及深度度量损失的统一形式,提出了自适应极映射损失函数(adaptive polar project loss)。实验表明,相比现有的损失函数,该方法在行人再识别任务中具有更好的性能。(3)针对常用的主干网络通常仅关注到全局粗粒度特征而忽略局部细粒度特征的问题,构建了基于注意力机制(attention mechanism)的行人再识别网络。针对行人图像所属相机域不同造成的差异问题,在网络中嵌入了增加模型泛化性与鲁棒性的实例批量正则化(instance batch normalization,IBN)模块。实验结果表明,相比于传统的主干网络,构建的模型达到了良好的效果。
其他文献
铸牢中华民族共同体意识有着悠久的历史逻辑、清晰的现实逻辑和严密的理论逻辑。三重逻辑既提供了铸牢中华民族共同体意识的必要性重要性阐释,又提供了铸牢中华民族共同体意识的主要内容和努力方向。铸牢中华民族共同体意识应以社会主义核心价值观为引领,推进中华民族文化融合发展;不断完善中国特色社会主义制度,发展平等团结互助和谐的社会主义民族关系;努力提升治理效能,铸牢中华民族命运共同体根基,为实现中华民族伟大复兴
当代社会能源紧张,所以在工程中降低能量损耗、节约能源是很有必要的。LLC谐振变换器由于具有高开关频率、功率密度高、可以实现全负载范围内的软开关、调压性能好等优点,符合现代电力电子技术对开关电源的需求。被广泛应用于各种场合之中。说明了半桥LLC谐振变换器的基本拓扑和稳态运行模式,在不同的开关频率下变换器具有不同的运行模式,分析了单个周期内开关管的开通关断、开关管旁路电容的充电放电情况。并通过基波近似
再生混凝土(RAC)的应用对于建筑业实现经济效益提升和碳中和愿景目标下的可持续发展具有重要意义。强度作为再生混凝土性能的重要指标之一,基于机器算法对其开展智能预测的研究仍处于起步阶段。另外对于RAC的环境和经济性的单一研究居多,全面考虑RAC可持续性的配合比设计尚有不足。本文基于文献调研获得328组RAC实测配合比数据集1,采用机器学习的方法对数据集1进行模型训练,进一步在RAC强度预测和可持续评
学位
本论文以溴基准二维有机-无机杂化钙钛矿材料为基础,通过探索新的薄膜制备方法来优化准二维钙钛矿材料的发光器件,并基于优化器件模型研究了这类器件中载流子动态输运及辐射复合过程。具体工作如下:1.准二维钙钛矿发光二极管相调控及光电性能研究。在此项工作中,我们采用了真空辅助退火的方式快速蒸发溶剂来加速结晶过程,可以实现不同n值的钙钛矿组分随机的分布于整个薄膜中,这意味着钙钛矿相分布在垂直尺度上得到有效调控
学位
目前,地球面临着全球变暖的问题,气候复杂多变,且环境问题日渐突出,各个国家开始意识到二氧化碳减排的重要性。2020年7月份,国际上已有60多个国家宣布碳中和目标。我国作为制造大国,碳排放量居高不下,为了更好的促进低碳经济发展,实现制定的2030年碳排放达到峰值的目标,我国已建立了7个碳交易的试点城市,并且取得了成效,根据国家的最新政策安排,2021年将正式逐步启动碳排放量较高的行业上线交易,建立全
脑机接口是在大脑与外部设备之间建立的一条直接交流的通道,它能够对脑电信号进行解码,利用脑电信号控制外部设备。该技术在近些年发展迅速,不仅能帮助人们进行医疗康复,在军事、教育以及航空等多个领域都有广泛的应用。脑机接口的关键在于脑电信号的分类,分类的精度决定了脑机接口系统性能的优劣。运动想象脑电信号无需外界刺激,自发产生,是脑机接口系统使用频率最高的脑电信号之一。但是由于信号本身的非线性非平稳特性,目
轴箱轴承作为动车组走行部的主要构成部件,起着连接转向架构架和轮对并传递两者间作用力的重要作用,所处的工作环境复杂恶劣,其性能对列车的运行安全有着直接影响。保持架作为轴承的关键部件,其在运用过程中的状态影响着轴承的工作性能,因此保持架的振动特性分析与寿命预估对保证轴承的安全运用具有重要的意义。本文以某型动车组轴箱轴承为研究对象,分别建立了轴箱轴承动力学模型、轴箱轴承有限元模型以及动车组列车车辆-轨道
近些年来随着个人移动设备的发展,VR/AR成为热门研究课题,应用领域广泛,实现AR场景感知和地图构建的关键技术就是同步定位与建图(SLAM)。随着移动设备往小型化和便携化方向发展,视觉SLAM成为一个重要研究方向。视觉SLAM中最主要的两个模块为视觉里程计和回环检测,前者用来估计帧间位姿,后者用来消除累积误差。传统SLAM利用手工特征来完成视觉里程计和回环检测任务,用特征点和特征描述子来描述图像特