【摘 要】
:
在多媒体技术高速发展背景下,视频监控被广泛应用于公众场合,行人再识别也成为了当前计算机视觉和模式识别领域的研究热点。行人再识别旨在解决监控场景下的跨摄像头行人识别与检索任务。其中,如何降低模型的过拟合风险,如何学习具有相机不变性的行人视觉表达,如何提升模型在跨场景下的性能,如何有效利用无标注数据,是行人再识别在复杂监控场景下的四大关键难题。本文针对这四个关键难题开展相关研究工作,主要围绕数据增强、
论文部分内容阅读
在多媒体技术高速发展背景下,视频监控被广泛应用于公众场合,行人再识别也成为了当前计算机视觉和模式识别领域的研究热点。行人再识别旨在解决监控场景下的跨摄像头行人识别与检索任务。其中,如何降低模型的过拟合风险,如何学习具有相机不变性的行人视觉表达,如何提升模型在跨场景下的性能,如何有效利用无标注数据,是行人再识别在复杂监控场景下的四大关键难题。本文针对这四个关键难题开展相关研究工作,主要围绕数据增强、图像风格迁移、域自适应和重排序四个方面,力求为监控场景下的行人再识别提供理论参考和实践意义。在降低过拟合风险方面,本文提出了一种简单且有效的数据增强方法,用于提高模型的泛化能力;在相机不变性的视觉表达方面,本文提出了一种基于相机风格迁移的数据增强方法,以提高模型对相机变化的鲁棒性;在模型的跨场景自适应和无标注数据利用方面,本文提出了三种无监督域自适应方法,旨在提升模型在跨场景下的性能;同时,本文提出了一种无监督的重排序方法,通过充分利用无标注测试样本之间的邻域关系,加以提升识别精度。本文的主要创新点包括以下五个方面:·为降低深度模型的过拟合风险,提出了随机擦除数据增强方法。本文通过随机遮挡策略丰富训练样本,用于提升模型的泛化能力。该方法不仅能够有效应用于行人再识别任务,还可以便捷地扩展到其它视觉任务。大量实验证明本文提出的方法能够稳定提升不同模型在多种视觉任务下的识别性能。·为缩小不同相机之间的数据分布差异,提出了基于相机风格迁移的数据增强方法。本文利用生成对抗网络实现图像在不同相机下的风格迁移,用于扩充训练样本并提升模型对相机变化的鲁棒性。同时,该方法也被扩展到后续的域自适应问题。实验证明本文提出的基于相机风格迁移的数据增强方法可以有效提升有监督模型的识别率以及无监督域自适应模型在新场景的泛化能力。·为利用行人再识别数据集的特有性质,提出了异构同构学习的域自适应方法。本文基于不同数据集行人不重叠性和域内相机不变性,构建了可用于自适应模型训练的三元组样本。实验证明,本文提出的异构同构学习方法能够有效提升模型在目标数据集的泛化能力。·为利用目标域样本之间的相互关系,提出了不变性学习的域自适应方法。本文通过探究目标域中样本之间的潜在不变性,基于记忆模块和图卷积网络构建了针对不变性的学习框架,该框架能够显著提升模型在目标场景的识别性能。实验证明本文提出的不变性学习方法在三个公开的大规模数据集上都取得了当前领先的性能。·为改善初始检索排序,提出了k-互近邻编码重排序方法。本文通过考虑样本之间的邻域关系,并基于集合编码方法优化图像之间的相似性,从而获得更精确的检索结果。大量实验证明本文提出的重排序方法可以在无需人工交换和标注信息的情况下,稳定提升不同方法的排序结果。综上,本文关注监控场景下的行人再识别研究,针对深度模型的过拟合风险、学习相机不变性特征、模型的跨场景自适应以及无标注样本的有效使用,提出了不同的算法模型,并通过大量实验结果验证了算法模型的合理性和有效性。本文提出的方法具有很强的实用性,并且大多可以便捷地扩展到其他视觉任务中。
其他文献
随着能源从传统的石油向页岩气资源转变以及国际地缘政治的影响,发展低碳烷烃(C2-C4)催化转化制备烯烃技术越来越受到重视。相较于直接脱氢(DH),氧化脱氢(ODH)具有很多优势包括无积碳、不受热力学平衡限制等。对于常见的金属氧化物基催化剂,依然很难避免烯烃的深度氧化。而对于非金属硼基催化剂,无论是早期报道的负载型B2O3基催化剂还是近期比较热门的h-BN催化剂,都可有效地抑制深度氧化的发生,获得很
电子转移的理论研究一直以来都是许多领域关注的焦点,其中最重要的挑战是电子转移前后透热态的构造。作为量子化学最基本的两种理论,分子轨道理论因简单高效比价键理论更为流行。然而,离域的本质使得分子轨道方法在构造电荷定域的透热态时非常困难。与之相反,经典价键方法使用非正交的定域轨道构造电子波函数,因此被认为是最适合构造透热态的方法之一。作为价键理论最简单的变体,块定域波函数方法可以通过自洽场迭代的方式获得
为了缓解日益严重的能源危机和环境污染等问题,发展可持续的能源储存技术非常重要。如今,已经商业化的锂离子电池还在努力地提高电池能量密度,减小生产成本,满足动力汽车和大规模的智能电网能源储存设备的需求。近来,双离子电池,作为一种新型的能源储存器件,因其具有高的能量密度,长寿命和低成本等优势逐渐被电池研究者们所关注。然而,由于双离子电池的发展还处于初期阶段,能量密度还有待进一步提高,涉及电池充放电过程中
表面等离激元(surfaceplasmons,SPs)因其优异的限域光以及近场增强等特性,在物理学、化学、生物学、通信、能源等领域具有广阔的应用前景,吸引了越来越多科研人员的密切关注。在表面等离激元的相关研究迅猛发展并取得了一系列令人鼓舞的研究进展的同时,表面等离激元的模式表征方面仍然存在许多尚未解决的科学问题。如利用传统的线性光谱表征SPs模式的研究中,仍缺乏对SPs模式线宽综合调谐的指导方法;
生物碱是一类具有显著生理活性的天然产物,它们广泛存在于植物中。在众多的生物碱中,又以吲哚及其衍生物类型的生物碱的数量最多,大约占1/4。钩吻,俗称断肠草,全株都有毒性。从钩吻中分离获得的钩吻碱(Gelsemine),是一种氧化吲哚型生物碱。钩吻类生物碱的活性研究表明,其具有抗肿瘤、镇痛、免疫调节、扩瞳、促进造血功能等多方面的作用。钩吻碱的结构自从1959年通过X-单晶衍射确定以来,因其具有特殊的六
本论文主要采用第一性原理方法研究了硼烯与氢化硼烯材料的结构稳定性、能带调控以及力学性质。本论文的研究结果主要分成以下五个部分:(1)第一部分主要是预测氢化硼烯材料的晶体结构并判断其稳定性。研究结果表明,和之前文献报道的Chair构型相比,我们得到了 4种新的具有更低能量的氢化硼烯构型。这四种新的构型都具有狄拉克锥,并且狄拉克点位于费米能级处,是零带隙半导体。最后我们通过声子谱计算验证了 4种新构型
拉曼光谱作为一种光谱学技术,可以提供分子振动与转动的指纹信息,但由于分子的拉曼散射截面小,拉曼信号很弱,很长一段时间内,拉曼光谱的发展处于停滞阶段,直到1974,表面增强拉曼光谱(Surface Enhanced Raman Scattering,SERS)的出现,才为拉曼光谱的实际应用带来了曙光。然而由于只有金、银、铜等少数金属材料具有强的拉曼增强效应,且拉曼增强效应的产生需要纳米级别的粗糙表面
纳米尺度上精确控制材料组成、结构、形貌和相态,是实现材料性能增强、多元及智能化的重要途径之一。中空结构纳米材料因其独特的空腔、可观的比表面积、易于功能化的壳层,已在催化、能量转换、传感和生物医学等领域显现出巨大的潜在应用价值。发展简单、高效、可控且具有广泛普适性的中空结构制备方法,实现空腔尺寸和壳层厚度的精准调控,对于充分发挥中空纳米材料本征性能,甚至衍生出新的特性,具有重要意义,近年来已成为复杂
二维材料具有较大的比表面率和大量的不饱和原子在物理、化学、材料科学等领域具有重要的应用。目前,湿化学合成因其强大的可控性,被认为是制备尺寸和厚度可控的二维纳米材料的一种方便、可重复的方法,具有良好的工业应用前景。但是,对其合成过程大多数是基于非原位研究,往往都是猜测,并未有直接证据。因此,采用原位手段表征方法获取信息对于深入认识二维材料的生长机理及其动态转化过程在指导精准控制合成二维材料领域有着重
自20世纪60年代微电子学取得突破性进展以来,微型化成为了一种新的发展趋势,对科学和技术的所有领域产生了巨大的影响。在分析化学中,色谱系统的微型化已经成为分离科学的一个关键趋势,其中纳流液相色谱作为高效液相色谱的微型化,具有溶剂和样品消耗少、色谱稀释效应小、与质谱联用更为友好等优点,使得纳流液相色谱在生物医药、食品和环境分析等领域得到了广泛的应用。液相色谱微型化的重要标志是色谱柱的微型化,因为色谱