基于深度学习的跨模态行人重识别研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xtljj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别在安防领域有重要的应用,而跨模态行人重识别可以在异质数据中匹配相同身份的行人,可以解决全天候监控的问题。相比于手工设计的特征匹配方法,基于深度学习的跨模态行人重识别算法在精度、鲁棒性方面都有很大的提升,因此基于深度学习的跨模态行人重识别算法在学术界和产业界引起了广泛关注。本文针对跨模态行人重识别任务,从神经网络结构、损失函数两个方面对基于深度学习的跨模态行人重识别算法进行分析与设计。与现有论文相比,本文设计的方法在跨模态行人重识别的两个公开数据集SYSU-MM01和Reg DB中取得了领先的精度。本文的主要工作包括以下三个方面:(1)设计了一种基于困难五元组的特征提取框架,该框架具有高精度、可扩展性的特点。该框架使用改进的单模态行人重识别网络作为特征提取模块,现有的单模态行人重识别模型相比于分类网络有更强的特征提取能力,同时具有高度可扩展性。此外,本文设计了困难五元组损失函数以及相应的困难五元组采样方法。困难五元组损失函数由全局三元组和跨模态三元组损失函数组成,前者同时处理了模态内变化和模态间变化,由于模态间变化更大,后者增强前者对模态间变化的关注力度,该损失函数在训练效率、精度等方面有显著提高。在该框架中,我们级联困难五元组损失和身份损失函数,进一步提升了精度。(2)设计了一种基于多粒度特征的双通道网络。两个通道由两个结构相同但参数不共享的特征提取模块构成,两个特征提取模块分别提取红外图像与可见光图像的行人特征,每个特征提取模块由一个全局特征分支和两个局部特征分支组成,融合全局特征和局部特征的策略使网络具有提取多粒度特征的能力,使模型可以关注到行人不同部位的细节特征。最后通过身份损失和异质中心损失函数来提升特征向量的判别性。(3)设计了一种基于梯度协调机制的身份损失函数,一定程度上缓解了易样本和由于模态差异过大造成的离群点对模型训练的影响。在模型结构不变的情况下,通过梯度协调机制辅助身份损失来提升训练结果,该方法具有扩展性。
其他文献
近年来,SQL注入漏洞一直被国际OWASP(Open Web Application Security Project)组织列为Web应用高危安全漏洞之一。面向SQL注入漏洞检测的恶意数据生成成为学术界和产业界研究
当下,深度学习可解释性是最前沿且重要的科研难题之一。可解释深度学习中许多问题都可以归结为高维概率分布转换,如工程中应用广泛的生成模型、领域自适应等。目前可以计算高
三维场景重建广泛地应用在移动机器人、无人机、无人驾驶、增强现实和虚拟现实等领域,有着重要的科研价值和应用意义。通过视觉同步定位与地图创建(SLAM)来进行三维场景重建
作为改革开放最先进的城市—深圳,经过40年的快速发展,当年的小渔村已成为中国最大的城市之一。因改革开放初期粗犷式发展,之前的城市规划已无法满足现代城市的发展需求,原广
目前主流的3D立体显示技术采用基于双视点图像的的平面立体呈现手段,左右视图中引入的水平视差带来了观看者对于场景深度的体验。然而,随之出现的3D内容观看者的视觉疲劳与舒
区间概念格是最近几年给出概念格结构,它是定义在一个给定的参数区间上的,能巧妙体现确定及不确定性信息的格结构,这种格结构为不确定规则提取的研究奠定了新的基础。以此为
俄罗斯企业收入70%来源于传统产品与服务,20%来源于对传统产品与服务的改善,仅有10%来源于技术创新。虽然近年来随着科技发展,这种情况有所改善,可技术创新带来的收益占比仍
聚类是一种无监督学习方法,能够在没有任何经验信息的条件下发现数据真实分布,这一特性,使得聚类分析备受关注。谱聚类基于图论将聚类问题转化为无向图的图划分问题,相较于传
目前,以智能终端和移动网络为依托的第三代支付风起云涌,面对快速发展的第三方支付业务,以第三方支付为主营业务的相关企业,要有一套科学的、符合企业自身实际情况的绩效考核体系,从而优化企业的人力资源管理体系,调动企业内部员工的积极性,进一步为企业创造更多的价值,最终推动企业的健康、平稳发展。本文以LKL新疆分公司作为研究对象,通过对该公司的组织结构,人员分布以及员工工作状况进行分析评估,找出了目前该公司
随着工业自动化的发展,化工生产过程对故障检测技术的要求越来越高。面对石油钻井过程这类复杂化工过程,传统的故障检测方法存在检测效率低,实时性能差和对噪声的鲁棒性较弱