基于无锚框相关滤波的目标跟踪算法

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yy19880904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪一直是计算机视觉领域最基础的任务之一,在智慧城市、智能安防、人机交互等领域都有很广泛的应用场景。随着深度学习技术的引入,目标跟踪算法的性能得到了巨大的提升。目前的主流目标跟踪算法都是以孪生网络为基础进行改进的,在孪生网络中,可以实现准确,快速的跟踪。但是在一些复杂场景中,比如前景与背景相似,遮挡,快速运动等场景,基于孪生网络的跟踪器表现得不够鲁棒。此外,目标检测领域中锚框的引入给跟踪算法带来了繁重的参数量,而且需要经过多次迭代和训练才能获得一个很好的效果。因此单目标跟踪是一项挑战性很强的任务。本文以相关滤波网络为基础,并针对以上提出的复杂场景提出了新的基于无锚框相关滤波的目标跟踪算法。本文的主要工作和创新点如下:第一,为了解决目标跟踪过程中的遮挡问题,本文提出了一种基于流的跟踪算法。该算法能够基于帧与帧之间的互相关系来检测遮挡目标,从而解决跟踪过程中的遮挡问题。通过在特征提取网络中引入通道注意力机制来补充特征中的语义信息。第二,本文设计了一种高分辨率网络,可以保持输入分辨率和输出分辨率相同。在网络设计阶段,本文分析了相关滤波网络中网络深度不能过深的原因,实验表明,基于相关滤波的目标跟踪算法必须要保证输入特征和输出特征的分辨率要尽可能一致。第三,在数据集处理阶段,分析了在传统孪生网络中使用的数据集,本文证明了训练集中非语义背景和带有语义背景之间的不均衡是学习过程中主要的阻碍。本文引入了大规模数据集ImageNet和目标检测数据集COCO来扩展正样本对的比例。第四,为了使得获得的特征鲁棒性更强,本文提出了使用特征融合方法将高级特征与低级特征融合起来并计算其相似度的方法。在传统的目标跟踪网络中,大多只单独使用高级特征或者低级特征。低层特征分辨率更高,包含更多位置、细节信息,但是其语义性更低,噪声更多。高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。融合高级特征与低级特征提高了特征的鲁棒性。最后,本文在 OTB-2015,VOT2018,UAV123 和 LaSOT 基准数据集上对所提算法进行了大量实验,多个实验表明本文所提算法在处理具有挑战性的场景时,相比其它方法,具有更强的鲁棒性。在测试过程中,跟踪器无需多余的技巧就可以按照超过56 FPS的速度运行,满足实时性。
其他文献
高品质、高效率的单光子源是实现量子信息通信技术的核心部件。半导体量子点有着“人造原子”的别称,具有高量子效率、高亮度、易于集成等优点从而成为制备单光子源的理想固态系统。受腔量子电动力学的影响,与腔耦合的半导体量子点单光子源的各项性能更是得到大幅度提升。本文以制备高效率的微腔耦合量子点单光子源为目标,计算分析了量子点能级结构,讨论了量子点的跃迁机制并基于腔量子电动力学得到了高效率半导体量子点单光子源
随着互联网的迅速发展,当今正处在一个信息爆炸的时代,各种信息呈指数级增长,在这其中,文本信息占据了相当重要的组成部分,因此从非结构化的信息中提取出有用的结构化信息显得尤为迫切和重要。信息抽取(Information Extraction,IE)就是旨在从非结构化的自由文本中抽取出结构化信息的技术。关系抽取任务为从非结构化的自由文本中抽取出“实体1-关系/属性-实体2/属性词”的三元组结构化信息,可
图像分割是计算机视觉领域里的一大核心研究方向,是为图像中具有相同或类似特征的像素预测其所属分类的技术。目前被广泛用于自动驾驶、增强现实、人机交互和生物医学影像等图像处理相关工程应用领域。多视点图像中对于目标的分割任务是三维显示应用中的一个关键步骤,分割的精度及多视点图像之间分割结果的一致性都关系到后续的三维显示效果。因此对于多视点场景,不能局限于单视图中分割边缘的准确度,还要考虑不同视点间的分割结
随着人工智能的迅猛发展,在线编程教育的重要性也日渐提高,对于在线编程教育的推广也逐渐丰富起来。而微信平台不仅拥有庞大的活跃用户数,同时兼备便捷性,开放性的特点,成为一种受大众青睐的互动方式。所以为了实现对在线编程教育的推广与营销,面向在线编程的公众号也相继而出。但是目前市场中存在的编程类公众号仍存在一些不足。如:功能模块划分不清晰,提供服务较为单一等。通过对各种编程类公众号的调研,结合用户应用需求
目前,随着互联网和移动通信的快速发展,产生了许多新型业务,同时网络数据流量也在经历着爆发式的增长。在有限的带宽资源下,如何为各种新型业务提供服务质量(Quality of Service,QoS)保障仍然是需要解决的问题。传统的网络架构由于功能耦合而无法满足不同服务对QoS的需求。软件定义网络(Software Defined Network,SDN)技术是一种新型网络架构,能够将设备的控制平面转
信息通信技术飞速发展的今天,网络设备被要求具备高实时和高可靠等特性,基于上述需求,IEEE 802.1工作组提出了时间敏感网络(Time-Sensitive Networking,TSN)相关标准协议。TSN 是能够提供低时延传输、保证通信带宽的确定性网络,即可以保障端到端通信的确定性和可靠性。同时,随着网络越来越复杂,网络设备越来越多,网络配置是否具备便捷性、是否具备准确性的问题就越发突出,如何
未来的无线通信网络将包含更多和更为复杂的应用场景,而高动态通信便是其中的重要场景之一。传统的时频域波形技术如正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)可以对抗由于信道时间色散所引起的符号间干扰,但是在高动态通信中,由于多普勒频偏所造成的信道频率色散会破坏OFDM子载波之间的正交性,进而引起子载波间干扰,成为制约当前OFDM系统性能
随着智能移动终端的普及以及网络基础建设的完善,无线自组织网络的应用越来越广泛。车联网(Vehicular Ad Hoc Network,VANET)和水下传感器网络(Underwater Sensor Networks,UWSWs)是无线自组织网络在不同场景下的特殊应用。近年来随着对智能交通的研究深入以及对海洋资源勘测的迫切需求,VANET和UWSNs都受到了越来越广泛的关注,而高效的路由技术是保
近年来,无人机以其灵活、易部署等独特的优势在民用以及军事等各大场景中备受瞩目,同时也吸引了学术界对无人机技术的广泛研究。但在实际通信过程中,无人机会受到气流、机体的机械振动等因素的影响发生三维空间的随机抖动。这不但会影响空地通信链路的稳定性,还会对无人机空地通信的网络性能产生影响。本文考虑无人机的抖动特性,重点研究了无人机辅助通信场景下抖动对于空地通信覆盖概率与网络容量的影响,对未来设计有效的无人
随着移动互联网的普及,无线视频直播业务发展迅速。与点播业务不同,直播内容是实时生成的,且对时延有更高的要求。作为应对无线信道时变特性的有效途径,自适应流媒体技术支持直播用户动态调整视频码率,受到广泛关注。考虑到直播场景中常会有大量用户同时观看相同内容,适合采用无线多播技术共享传输资源,研究如何将其与自适应流媒体技术有效结合以提升系统性能具有重要意义。与此同时,若不同用户请求内容各不相同,则难以满足