基于对抗生成网络和哈希匹配的行人重识别研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,大多数的公共场合都有监控摄像头的存在,如何利用这些监控视频数据来更好地方便人们的生活,成了计算机视觉领域研究者们需要思考的一个问题。我国早在21世纪初就建立了“天网系统”,那么在互联网时代下如何更加有效、更加高效地利用“天网系统”来对犯罪分子进行快速追踪和定位就成了计算机视觉领域亟需解决的问题;当幼儿在游乐园等人群密集的场所走失,如何运用监控视频大数据快速地帮助家长定位该儿童位置也是计算机视觉领域需要考虑的问题。行人重识别任务主要适用于多个摄像头拍摄的场景,当进行单张图像查询时,将给定的单张行人图像与大型图像数据库中的图像数据进行比较,以判断不同摄像头下出现的行人图像是否同属于一个行人。在实际的应用实现过程中,行人重识别任务受到两个因素的制约:一是行人重识别数据集采集受限,由于政策、个人隐私以及其他原因,学者以及一般的企业都无法大规模采集行人的数据用于行人重识别任务;另外则是已有的行人重识别数据之间存在的偏差,这些偏差主要来源于相机的视角之间的偏差、拍摄到的人群的姿态之间的偏差以及数据集存在跨域问题所带来的偏差。已有的行人重识别系统主要针对公开数据集进行训练,这些行人重识别系统往往在单个训练集上能取得比较好的结果,但是在针对数据跨域问题时,这一类行人重识别系统往往不能令人满意。总而言之,已有的行人重识别系统存在的主要问题包括:不能实现跨域的效果、检测的效果不佳、检测的速度不够快等。基于此,本文提出了一种基于对抗生成网络和哈希检索的行人重识别算法,其主要创新点如下:1、采用了基于人体姿态的对抗生成网络;本文采用的方法通过与目标姿态相结合的方式生成对应的行人姿态图像;弥补了行人重识别数据集中行人关于姿态的偏差问题;2、采用基于注意力机制的深度残差网络,进一步提取出行人的关键性特征,使得提取出来的行人特征更方便用于行人重识别任务;同时采用差异权重的方式进行特征融合。3、采用了哈希匹配的图像检索方式,在深度残差网络中加入哈希层,在提取行人特征的同时学习哈希函数;哈希函数可以将行人图像转化为二值码,不同行人对应的图像二值码距离不同,将二值码之间的距离由小到大进行排序,得到检索结果。本文提出的方法在检索速度以及检索精度上都实现了比较好的效果,通过pytorch进行深度学习网络的搭建,最终实验结果表明本文采用的基于对抗生成网络和哈希匹配的行人重识别方法比较适用于解决行人重识别领域的相关问题。
其他文献
自上世纪九十年代起,信息无障碍就引起发达国家的注意。让更多的残障人士、老年人等信息获取弱势群体通过互联网获得平等信息获取机会、继续为社会创造价值,成为越来越多的国家推进信息无障碍的目标。我国的信息无障碍发展比发达国家起步晚,即使目前仍有差距,但是现在信息无障碍建设工作的开展在国内正在获得社会各界的重视和帮助,并取得了相应成就。公共图书馆网站作为一个蕴含无数数字信息资源的信息知识传播中心,肩负着缩小
长期以来,我国农业采取粗放型生产方式,农业经济发展建立在化肥、农药等生产要素高消耗、低利用和污染物高排放基础上,造成我国农业生态环境不断恶化,可持续发展严重受阻。因此,需要寻求生态友好的农业发展模式,突破当前农业发展面临的困境,循环农业遵循“3R”发展原则,保护生态环境,资源高效利用,是农业可持续发展有效模式之一。近年来,我国循环农业蓬勃发展,形成一些典型模式,需要科学依据评价这些模式应用的可行性
学位
随着智能语音技术的快速发展和人工智能相关应用的兴起,声学场景分类(Acoustic Scene Classification,ASC)已逐渐被应用到人们的日常生活中,它是利用音频信号处理和深度学习技术完成对声学场景(家庭、公园、街道场景…)的识别与分类,从而达到识别周围环境的目的。针对声学场景分类问题,本文从3个角度展开研究,分别是基于传统声学表征的声场分类、基于端到端的声学建模及基于多特征系统的
随着工业化进程加快,纺织业市场需求量不断扩大,生态环境中存在大量难处理的印染纺织废水。本文以聚丙烯无纺布织物(PP)为基材,通过辐射接枝的手段接枝甲基丙烯酸缩水甘油酯(GMA)进行预处理,后续分别选择胺类和β-环糊精,针对GMA支链的环氧基团进行开环,分别制备了用于催化还原4-硝基苯酚的PP-g-EDA@Ag/Cu、PP-g-DEA@Ag/Cu和用于吸附双酚A和其他染料的PP-g-βCD。本论文主
代码异味是由开发人员不良的编程习惯或者违背设计原则而引入的深层次软件质量问题,是糟糕的代码或设计的体现。在实际的软件系统中,一个类或方法可能同时存在多种代码异味,且一些代码异味有一定的相关性,一起频繁出现的概率较大,它们之间的相互作用使得代码的可读性和可理解性降低,增加了软件系统的复杂度和可维护性难度,从而导致软件质量明显下降。此外,代码异味有多种出现形式,如方法级的代码异味往往引起类级的代码异味
人类的皮肤位于人体的表面,是影响外貌的重要因素,也是人体抵抗疾病侵袭的重要屏障。皮肤色素分离,通过分析人体皮肤的彩色图像,从图像中分别计算提取出,色素的相对含量和分布数据,其中包括皮肤中的两种主要色素:黑色素和血色素。皮肤镜的图像分割,目的是为了检测皮肤损伤区域的位置和边缘轮廓。随着计算机技术的不断发展,使用计算机分析皮肤色素分布,对化妆品和医疗行业有良好的辅助作用。同时,计算机辅助诊断广泛应用于
宫颈癌是一种高致死率的妇科疾病,严重危害着女性的健康。目前,针对宫颈细胞的处理方法的核心技术主要包括三大步骤,分别是细胞分割、特征提取和特征融合、细胞分类。传统的宫颈细胞处理方法的性能很大程度上取决于分割的准确性和手工制作特征的有效性,且任意一个环节的处理都会影响最终的检测效果。目标检测算法将目标分割和识别合二为一,不需要任何的预分割步骤,只要能够保证检测算法的有效性,就能够保证最终的检测效果,加
随着经济全球化、区域一体化的持续推进,信息网络、交通运输的飞速发展大大地压缩了城市间的时空距离,城市间交流频率增加、速度加快,原有地理空间结构被一种网络的关系所渗透和重构,大、中、小城市在不同空间尺度下互联形成了一种复杂多元的网络型空间组织形式——城市网络。以“流动空间”视角构建网络模型近年来成为城市网络主题下研究的新范式。具有定位服务的互联网应用连续、稳定地记录其用户的出行轨迹为城市网络研究提供
大自然是万物的生长之源,从古至今自然都给予了人们无尽的智慧与向往。人类从自我意识觉醒之初便一直对大自然加以学习和模仿,随着社会的不断演变与发展,人们原有的生活方式也需要随着周遭的变化而做出改变。一些不可预知灾难的发生时刻警醒着人们,使大家逐渐意识到生态环境的重要性,人与自然在某种程度上来说是不可分割的。而理想化生态设计的延伸实质上也可以理解为仿生设计,它们都是对自然界的各种形式进行学习,对生命体及
传统的新药研发面临着投入高、耗时长、成功率低的困境。根据《美国医学会杂志》提供的数据,开发新药的平均成本约为28亿美元,新药研发的平均时长约为14年。药物合成路线设计实质上是一个化学分子逆向合成问题,即如何利用化学原料库中常见的分子设计出合成路线以合成目标分子。目前药物合成路线设计的主要方法为在单步逆合成反应预测模型的基础上结合蒙特卡洛树搜索算法进行路径搜索。当前药物合成路线设计模型仍然面临诸多困