基于深度学习的视频行人重识别改进与应用

来源 :江汉大学 | 被引量 : 0次 | 上传用户:wyt20070210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据图像从视频中查找特定行人的应用较为广泛,且多应用于安防领域。目前,行人重识别的研究大部分集中于图像检索方面,而针对视频的行人重识别较为匮乏,同时,它的需求却很大。论文将行人重识别和行人检测相结合,利用行人检测来捕获监控视角下所有行人的图像,并用相应的模型来检索这些图像中是否包含特定的行人,从而实现了通过图片查找和定位视频中的特定目标行人。进一步,在完成了行人重识别和行人检测相结合的基础上分别又对行人检测和行人重识别的方法选择做了研究和探讨并对行人重识别的网络进行了改进和优化。针对行人重识别预处理部分即行人检测方面分别使用了以HOG+SVM为代表的传统机器学习行人检测算法和以YOLO v3为代表的基于深度学习的行人检测算法,并分别对两种代表性算法进行了试验。试验结果表明基于深度学习的YOLO v3行人检测算法有更高的识别精度和更准确的行人候选框,因此更加适合当前的研究环境。在行人重识别方面,建立了基础的行人重识别网络模型,并在该模型的基础上,应用了多种数据预处理和数据增强相结合的手段。研究表明在行人重识别基础网络上加入随机擦除、填充(padding)、随机裁剪、随机翻转、随机噪声后行人重识别的识别效果有所提高。根据目标检测的评价指标m AP,模型在market1504的数据集上提高了4.5%,且其rank_1指标提高了1.2%。针对行人重识别网络在训练后期出现的过拟合现象,采用了在网络中加入Dropout随机断开神经元的策略。实验结果表明在Dropout概率为0.3时行人重识别的过拟合有一定的缓解。同时,在网络最后用Group Norm正则化替换掉Batch Norm正则化后,行人重识别模型能够在牺牲很少的m AP的情况下提前收敛,而网络的Rank_1指标几乎没有变化。最后,论文针对上述模型拓展了两种基于该功能的应用:(1)定位和查找需要检索的特定行人目标:(2)记录特定行人的路径并绘制出热点图。通过试验,验证了上述两种应用的可行性。
其他文献
达尔克罗兹体态律动教学法自传入中国后得到迅速的推广。本文首先阐述该教学法的基本观点、基本内容与教学目标。其次探究引入我国后的实用性与价值所在,为进一步的实践研究奠定理论基础。通过达尔克罗兹体态律动教学法的基本元素与其教学核心理念,设计出符合我国音乐课堂的具体教学手段;通过教学实例,研究出达尔克罗兹体态律动教学法应用于我国民族音乐教学的具体实践方式。最后对该教学法在音乐课堂中如何提高教学质量等相关问
近年来随着中国科学技术的迅猛发展,科研成果的数量出现爆发式增长。为了从科研成果中更高效获取隐性知识,并对科研人员进行针对性推荐,在多种类型的科研成果中选择中文科研论文为主要研究对象,做了以下几方面的工作:(1)对科研论文进行主题词提取。论文的主题词有别于其作者自定义的关键词。利用自然语言处理技术对科研论文数据进行清洗及归一化的处理,基于规则提取论文中的结构化数据,基于TF-IDF算法抽取论文的主题
学位
背景:宫颈癌(Cervical Cancer,CC)是世界范围内公认的一种常见癌症,具有很高的危险性。尽管宫颈癌化疗耐药和复发的分子机制已被广泛研究,但其关键分子尚未确定。寻找对新辅助化疗(Neoadjuvant Chemotherapy,NACT)有预测作用的分子生物学标记物十分重要。目的:讨论丝裂原活化蛋白激酶10(Mitogen-Activated Protein Kinase 10,MAP
自然的人机交互方式,相比于传统键盘鼠标的交互方式,更加简单和高效。优秀的交互应用场景应当具备人的表达准确,机器识别精确,场景展示明确等方面优点。虚拟仿真环境下的应用具有低成本、重复性高、工程操作安全、工程结构透明等优势,适用于各种复杂机械、人体观察等方面的研究。传统的键盘和鼠标无法满足这些复杂的交互环境要求,因此,自然交互技术在虚拟仿真环境中的应用更符合新环境的要求。本文以图像信息处理技术为核心,
豇豆(Vigna unguiculata(Linn.)Walp.)是广泛种植于热带、亚热带等地区的豆类作物,营养价值体现在优质蛋白和糖类,富含多种矿物质和保健因子等方面。目前豇豆营养品质的研究主要侧重于蛋白质和维生素C含量等,糖类化合物的研究报道尚少,且多为单一环境下少量豇豆品种的试验数据,影响到对长豇豆营养成份的认识和优异基因挖掘。本研究在遴选长豇豆核心种质后,采用裂区试验设计,系统地测定了30
随着互联网和云计算技术的迅速发展,移动用户激增使得互联网流量急速增长,大量用户对计算资源发出使用申请。如何对移动互联网流量数据进行高效准确的预测分析,为用户提供更加优质的移动网络服务;如何在资源有限的条件下,既能满足虚拟机请求的合理分配,又使云服务商的利润最大化,这些都是供应商们最为关心的问题。针对互联网服务背景,本文研究了改进的灰狼优化算法并用于解决互联网的流量预测问题及云服务虚拟机资源分配利润
相比于传统的机械转向结构,带有线控转向系统的汽车驾驶起来更加的轻便和稳定。它将传统机械转向结构的固定传动比变为可设计的变传动比,在固定的横摆角速度增益下,使传动比的大小只受到车速大小的影响,这便减少了驾驶员在低车速段时的操作负担和降低了在高速段时因方向盘过大而产生侧翻风险的概率。本文对搭建整车模型、传动比的设计方法、基于模糊PID的线控转向控制方法和软硬件实验分析这四个方面进行了研究,主要研究的是
1型糖尿病(Type 1 Diabetes,T1D)是一种好发于儿童和青少年时期的自身免疫性疾病,以胰岛β细胞永久性破坏为特征。目前对于触发T1D发生的自身抗原尚不清楚,尽管可用识别胰岛细胞抗原的抗体来协助T1D诊断,但针对这些抗原进行的免疫耐受治疗并未在临床上取得很好的疗效。为做好T1D的早期诊断,我们需要去寻找诱发T1D的自身免疫反应的始动抗原,进一步去探索T1D发生和胰岛损伤的病理机制,供于
脉冲神经网络受生物学信息处理方式的启发,通过稀疏的异步二元信号交流,并以大规模并行的方式处理,从而在神经形态硬件上展现出了良好的性能,例如低功耗、计算效率高、资源占用少等。另一方面,目标跟踪作为重要的计算机视觉任务,具有广泛的现实世界应用,例如人机交互、自动驾驶、机器人、基于运动的识别和安防等等。为了解决各种挑战实现更好的跟踪效果,目标跟踪模型设计的愈发复杂,导致计算量的陡增,模型占用大量资源,以