基于单次深度学习的目标跟踪方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:w734289467
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉中一个具有挑战性的任务。近些年来,随着深度学习技术的发展,基于单次深度学习的目标跟踪算法受到了人们的广泛关注。基于单次学习的目标跟踪方法指的是在离线训练的基础上,在在线跟踪的过程中不对模型调整,因此单次深度学习的目标跟踪算法较其他基于深度学习的跟踪方法在速度上有很大的优势。但是,在现在的单次深度学习算法中,大部分使用的都是较深层的特征,虽然深层的特征包含了更多的语义信息但是分辨率太低不利于目标的准确定位,这大大影响了深度跟踪算法的性能。在训练的过程中,存在着大量的容易样本,虽然它们产生的损失函数值较小,但是这些损失的累积可以主导梯度的更新方向进而影响训练的效率与效果。针对上述问题,受人类视觉机制的启发,本文设计了融合深度神经网络浅层与深层特征的两种方法,一种是将不同层的响应加权相加,另一种是基于自顶向下的特征融合模块,基于此获得对目标更加准确的表示。另外本文提出了在线困难样本挖掘以及基于合页损失(Hinge Loss)的容易样本处理方式,去从模型训练的角度提高模型的性能。在多个数据集上的实验结果结果验证了本文提出的多层特征融合以及容易样本处理方式的有效性,但是性能相比目前最优秀的方法(state-of-the-art)还是有差距。单次学习跟踪算法的局限性体现在缺乏目标的时序信息,无法预测目标与背景在后续帧中的变化。因此本文设计了基于单次学习机制的人工标注实验,结果表明虽然人眼具有很强的学习能力,人眼标注的结果并没有达到或者超过最优秀方法的性能。为了克服单次深度学习算法的局限性,本文将基于背景感知的相关滤波器嵌入到深度神经网络中,提出了利用时序信息的联合学习特征表示与截断推理过程的跟踪框架RTINet。实验表明,RTINet的性能超过了很多最优秀的方法,并且它的快速版本在损失较少精度的情况下能达到24帧每秒的实时跟踪速度。
其他文献
移动Ad hoc网络是一种特殊的无线移动网络,网络中所有节点的地位平等,具有报文转发能力。虽然这种网络目前在很多领域得到应用,但是还存在一些问题。由于Ad hoc网络中节点的移动
准确预测高炉铁水硅含量是有效控制高炉的前提。高炉冶炼过程是十分复杂的物理化学变化过程,而且高炉内部的生产条件非常严酷,通过仪器测得的信息十分有限,所以高炉铁水硅含量的
随着基于Web的企业应用系统的发展,Web 开发在企业应用系统中所占的比例逐渐增大。目前很多基于J2EE框架的企业应用系统中Web开发水平较低,主要表现为开发中的各种逻辑混杂导致
目前,流媒体业务在互联网应用中的不断发展,但是其速度却难以满足网络用户日益增长的需求,内容发布技术与网络硬件设备正在面对严峻的挑战。 本文通过对比分析了传统内容发布
随着企业对工作效率要求的提高,工作流的应用越来越广泛,对工作流的研究也正向更深层次进行。工作流主要分为两部分:工作流模型的创建和工作流的执行。目前工作流建模工具界面
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点
受天气预报技术的制约,目前国内市场尚无法提供高精细化的气象信息,在一定程度上影响了我国气象经济的总体规模,但是我国幅员辽阔,容易遭受各种极端天气的危害,相关行业急需不同领
嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件均可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。在嵌入式系统需求不断增长的
词的分类问题是语言学和自然语言处理中十分重要的研究问题。由一些语义相近的词组成的词类(或词聚簇)可以看成是纷繁的个别词现象到语言的一般概念的映射,而这些概念是更加本
随着电子技术和嵌入式技术的发展,音频数码产品的功能日益强大。从原始的卡带随身听到音乐发烧友挚爱的CD walkman,再到如今人手必备的MP3,MP4,嵌入式音频设备可谓经历了一次历史