基于图结构的无监督行人重识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xiyouyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别,目的是在不同摄像头中检索包含目标人物的图像。该任务是计算机视觉领域的一个研究热点,在智能安防、客户识别等方面具有重要应用。当前行人重识别算法仍存在以下挑战:1)高性能的行人重识别算法依赖大量标签数据提供的监督信号,然而在海量视频中进行人工标注代价巨大;2)受不同摄像头的拍摄角度、成像质量、光照、遮挡等因素影响,行人重识别算法通常跨域适配能力较为低下;3)现有的行人重识别算法大多数都是针对单模态的图像数据,无法支持跨模态行人检索。针对上述挑战,本文重点研究基于图结构的无监督行人重识别算法。具体而言,包括以下几个方面:1)我们提出了异构图驱动的无监督域适配行人重识别算法,通过在无标签数据间构建异构图,并充分利用无标签数据之间的异构相似度提升单模态无监督行人重识别的效果;2)为了充分利用多模态数据,我们提出了一个新颖的跨模态行人检索的任务,该任务包括了轨迹检索图像、图像检索轨迹、图像检索图像这三个子任务,同时,我们自行构建了一个多模态行人数据集,用于验证任务的可行性;3)针对跨模态行人检索任务,我们提出了跨模态无监督行人检索算法,通过相似度驱动模型来无监督学习图像与图像之间的关系,并利用异构表征学习构建融合轨迹与行人图像的异构图,最后利用三元-游走方法学习图节点的嵌入表征向量并进行跨模态检索。我们在公开行人重识别数据集以及自行构建的多模态数据集上验证了算法的可行性。同时,我们构建了一个多模态无监督行人重识别系统。该系统支持单模态无监督行人重识别,融合多模态无监督行人重识别,跨模态无监督行人检索等功能,为进一步促进行人重识别更好的落地提供了平台支持。
其他文献
快速城市化背景下,一些基于原始农业系统的物质与非物质要素在城市发展吞并的大趋势下被保留下来,形成具有丰富“遗产”内涵的农业遗存,与城市绿地结合以协调城市建设与自然生态环境之间的巨大压力,然而,此类农业系统的生产属性与城市绿地管理、人群使用之间的矛盾,使得农业遗存既面临着适应高强度城市建设的环境压力,又面临着与城市绿地协同发展,共同建构良好城市生态人居环境的挑战。基于农业遗存生产属性与城市绿地相互影
游戏为人工智能(AI)算法提供了一种有用的研究和测试平台。利用深度学习算法对游戏中玩家获胜者的预测是AI规划的重要组成部分。实时战略(RTS)游戏是一类流行的实时战斗模拟游戏,由于巨大的状态空间,有限的决策时间和动态的对抗环境,RTS游戏为利用深度学习算法对游戏中玩家进行获胜者预测提供了理想的环境。游戏(特别是RTS类游戏)以及游戏玩家获胜者预测在军事作战仿真系统设计中有实际的应用。本文对RTS类
废旧沥青混合料(RAP)作为一种路面可再生材料,近年来在道路修建中被广泛应用,具有可观的环保和经济价值。但由于RAP中老化沥青劲度过高,对疲劳和低温性能不利,使路面使用寿命降低,从而限制了RAP的再生利用率。为实现RAP的高效再生,可使用再生剂来软化老化沥青,同时改善新旧沥青的融合程度。尽管再生沥青及其混合料的宏观性能得到了广泛的研究,但不同再生方式下再生效果的对比和再生沥青中各组成成分(新沥青、
模块化多电平换流器(Modular Multilevel Converter,MMC)是柔性直流(Flexible-HVDC)输电常用的一种电压源型换流器(Voltage Source Converter,VSC),其具有开关频率低、拓展性强、电能质量高、制造难度小等优势,是学术界和工业界热门研究对象。为了保障换流器安全稳定运行,对其进行寿命评估有着重要意义。另外,元器件的劣化状况严重制约着MMC
近年来,我国持续加大基础设施建设力度,对隧道工程建设过程中的数字化、信息化的要求日益提高,因此探索和研究BIM技术在特长公路隧道工程中的应用具有很重要的实际意义。本文以广东某特长公路隧道工程为依托,针对隧道BIM与围岩地质体建模及其设计应用进行了研究。针对隧道BIM建模方面,在归纳现有隧道BIM技术与应用研究的基础上,首先针对隧道BIM建模方法进行了研究,提出了一种以Revit软件自带的公制常规模
随着海量多视图数据的产生,如何分析和融合这些异构的多视图数据成为当下迫切的需要。多视图聚类旨在利用多视图数据的公共和互补信息来进行聚类。多视图图聚类是多视图聚类最有代表性的其中一类方法。多视图图聚类首先为每一个视图的数据构建相似度图,然后融合多个相似度图为一个共享图,然后在融合图上完成聚类。我们在深入了解大量多视图图聚类的工作,准确度量相似度是该类算法的关键所在。然而已有多视图图聚类方法在构建相似
随着GPS技术的广泛应用及近些年来人们对健康的追求,用户习惯用各种运动软件记录自己的运动或活动数据,并基于社交平台可一键分享运动数据到朋友圈、微博等。各种软件则收集带有隐私信息的轨迹在内的数据以分析用户的行为习惯来推荐更多的个性化服务。同时,由于现在各种社交软件的功能扩展,用户的好友并不都是关系亲密的联系人。当用户在移动社交网络分享自己的运动轨迹时会无形泄露自身的隐私。对于社交网络中用户间关系强度
U型钢板桩是两侧带特殊锁口的一种具有复杂截面形式的结构,因其施工效率高、自愈效果好、绿色环保等诸多优点被广泛运用于支护工程中。由于钢板桩特殊的锁口连接方式,在受弯作用下钢板桩抗弯刚度的发展与锁口间接触咬合的变化过程具有较强关系,也使得钢板桩抗弯性能的研究存在一定的复杂性和不确定性。桩间锁口完全自由滑移时,相当于单桩抗弯;桩间锁口无相对滑移时,相当于理想桩墙抗弯;而实际工作中的钢板桩墙锁口间存在一定
刘震云的长篇新作《一日三秋》,由人及面地叙写离开延津的人对延津的惦念,以及延津人之间"一句顶一万句"的托付,而这惦念和托付里隐伏着的依然是中国人都能感知兴会的世情。小说以笑话立意,并将笑话视为洞见人性的机关,在由一则又一则的笑话串联的生死录中记下中国人关于生命悲喜体悟的"脉案"。小说在叙事上复归民间和传统,不但将人兽鬼神等量齐观,而且叙事结构灵活,叙事时间自由,首尾相贯,前伏后应,充溢着鲜活流动的
图像文本检测和识别算法可服务于众多下游应用,包括基于图像的搜索、商务信息处理、地理位置定位、即时翻译、机器人导航,工业自动化和人机交互等领域,具有极高的研究价值。图像中文字及其标注信息作为驱动图像文本检测和识别算法的“燃料”,对于提高其算法性能至关重要,在深度学习时代更显突出。智能标注算法包含三个内涵:1)预标注、2)人机协作标注和3)人机协作校对。然而,目前应用于文本图像标注的智能算法只有利用文