基于孪生网络的视频目标跟踪算法研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:licx1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标跟踪作为新兴技术被广泛应用于智能视频监控、自动驾驶和精确制导等民用和军用领域中,是一个重要且极具挑战性的研究热点。随着深度学习技术的崛起,孪生网络目标跟踪算法在视频目标跟踪领域中崭露头角。然而这种基于模板匹配的跟踪方法性能会受到模板质量的制约,在外观变化、相似目标干扰和遮挡等复杂情况下典型孪生网络结构不足以满足对整个视频序列的持续稳定跟踪,所以如何在这些复杂情况下稳定完成跟踪任务成为了孪生网络视频目标跟踪算法的研究难点。为提升孪生网络目标跟踪算法性能表现,本文在孪生网络框架下开展研究,选取具有代表性的SiamFC和SiamRPN算法进行改进,主要研究工作如下:(1)为提高SiamFC算法对目标外观变化的适应能力,提出一种融合多模板信息的孪生网络目标跟踪算法(SiamFMT)。该算法通过多模板框架存储目标不同状态的外观信息,同时设计有效的模板筛选机制,最后通过响应图融合获得更加可靠的响应图。在OTB100和VOT2016数据集下进行了仿真实验分析,结果表明在目标外观发生变化的情况下,本文所提方法可以有效提高跟踪性能。(2)为了进一步提升目标外观变化情况下的跟踪性能,在多模板框架的基础上提出一种模板库结构存储典型目标外观信息,并将其集成到SiamRPN算法中形成模板驱动的孪生网络目标跟踪算法(TDSiam)。同时根据余弦相似度设计一种特征融合模块更加高效的融合模板特征,在更加具有挑战性的UAV123和UAV20L数据集上的实验结果表明,本文所提出方法可以有效提升SiamRPN算法在目标外观发生变化的情况下的性能表现。(3)为了缓解跟踪过程中的漂移问题,在SiamRPN算法的基础上提出一种卡尔曼预测引导的孪生网络目标跟踪算法(SiamRPN-K)。通过卡尔曼预测步对目标运动状态进行短时估计,并根据预测结果和原始跟踪结果之间的差异性设计跟踪漂移检测方法,再依据分类响应分数和历史外观信息之间的余弦距离判断导致发生跟踪漂移的原因,最后采取不同的跟踪恢复策略恢复跟踪。OTB100和UAV123数据集下的实验结果证明了该方法的有效性和先进性。
其他文献
随着多媒体、网络技术的发展,图像的应用日益广泛,其成为了互联网中信息的主要载体。但是,由于对图像的质量要求越来越高,导致维数灾难。高维图像数据不仅要占用大量内存空间,而且信息的冗余程度很高,将会影响后续图像识别的性能。特征提取是图像识别中的关键步骤。如何从图像的原高维空间中找出潜在的本质低维结构信息对图像识别等是非常有意义的。低秩表示作为高维数据信息表征的有效工具,在图像识别领域取得了不错的效果。
学位
近年来,随着计算机图像处理技术的不断进步,带动了传统中医新一轮诊疗方式的客观化研究。舌诊是中医望诊领域的主要内容,其诊断方法独具特色,在判断病人病情方面具有极为重要的作用。传统中医辨别舌色、苔色、裂纹等舌象特征,主要通过中医师的视觉观察和经验分析,所以在判断标准上,会受到诊治医生主观因素和周围环境等因素的影响。这些因素制约了舌诊的应用与发展,所以使舌诊信息客观化,诊断标准化是当前舌诊自动化研究的重
学位
随着现代制造业的不断发展,我国工业生产领域逐渐地趋于自动化,电网是工业生产领域发展依靠的基础,而变压器的稳定运行是维护电网安全的关键。因此,加强变压器运行状态的检测,及时发现其潜伏性故障,并制定具有前瞻性、预见性的故障诊断策略,对于提升电网的安全可靠运行具有重要的意义。通过对变压器故障诊断方法的深入研究,为解决传统比值法易出现比值边界模糊、编码缺失等问题,弥补智能算法在小样本上易过拟合的不足,论文
学位
纹理是不同的计算机视觉任务和应用程序的重要特征,是人类感知世界的重要视觉线索,和我们的生活息息相关。因为纹理分类在理解纹理识别过程中发挥着重要作用,所以纹理分析的主要问题之一就是纹理分类。在纹理分类任务中,局部二值模式(Local Binary Pattern,LBP)是应用最广泛的一种分类方法。局部二值模式是一种用于提取局部纹理信息的简便且鲁棒的纹理描述符,而且局部二值模式具有光照不变性和旋转不
学位
随着智能电网的快速发展,电网在运行过程中积累了各种类型的巨量数据,运用数据分析技术对这些巨量数据进行分析可以获得很多平时所注意不到的信息,将这些信息用于指导电网运行中的日常工作可以极大的提高电网运行的质量。而电网负荷预测作为电网运行过程中重要的管理手段,预测的精准度直接影响了电网运行的成本、电网运行方式以及电网设备的检修维护计划等。但因为不同地区的电网负荷变化规律是受多种外在因素共同影响的,比如当
学位
语义分割作为图像处理的一个重要基础任务。其基本思想是以像素为单位,将图像中所包含的各类物体逐一进行分类,并把同属一类别的像素标记为相同的颜色。图像语义分割的出现,可以帮助计算机更好的理解图像中所表达的内容。近几年,相继提出了许多基于卷积神经网络改进的语义分割方法,语义分割精度也不断提高。但是大多数的语义分割模型都存在计算复杂、参数过多等缺点。基于以上研究现状,本文以实现分割精度和推断速度的平衡为目
学位
红外目标跟踪作为计算机视觉的一项基本任务,在智能监控、辅助驾驶和红外制导等领域发挥着重要的作用。在实际应用中,红外目标易受到形变、背景干扰以及遮挡等因素的影响,使得红外目标的稳定跟踪成为一项极具挑战的任务。为了增强红外目标跟踪的鲁棒性,本文以孪生网络为基本跟踪框架,从模型训练、特征融合以及遮挡预测三个方面进行研究,具体内容如下:(1)在有限的训练资源下,使用CIOU(Complete Inters
学位
微博的快速发展使得信息的传播更加快速和便捷,但是虚假信息的传播可能会对广大网民产生负面影响,造成平台管理困难,社会动荡,严重情况下甚至会对国家的发展造成冲击,因此对微博中的内容进行可信度评估具有重要意义。在充满数据的时代,深度学习技术中的循环神经网络、卷积神经网络等模型具有出色的数据挖掘能力,通过对已有数据进行特征挖掘,预测新数据的可信情况,但是微博中蕴含大量不同类型的数据,在特征挖掘时还存在一系
学位
纹理作为一种重要的视觉线索,广泛存在于自然界各种物体的表面,在图像中表现为特征值强度的某种局部重复模式的宏观表现。纹理图像分类研究有超过50多年的历史,期间提出了许多理论和算法,主要包括基于传统手工描述符的算法与基于深度学习的方法。传统手工描述符方法通常是基于对纹理的一些假设而手工制作的特征,由于不同的纹理数据集包含不同类型的纹理,因此,手工描述符的表现通常是因数据集而异。与此同时部分纹理数据集的
学位
随着互联网的快速发展,网络中的用户量和信息量激增,信息过载成为互联网用户面临的重要问题。推荐系统能够分析用户在网络中的历史行为,进行用户建模,以实现个性化的推荐。作为解决信息过载的重要工具,推荐系统已广泛应用于电子商务、个性化广告推送、多媒体内容推荐等众多场景。在个性化推荐的帮助下,用户可以方便快捷地获得感兴趣的信息和产品。根据用户历史记录和辅助信息等信息对用户建模,挖掘用户的偏好,对用户进行推荐
学位