基于显著特征选取的在线多目标跟踪方法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:ksh0323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多目标跟踪(MOT)其主要任务是给定一个图像序列,找到图像序列中运动的物体,并将不同帧中的运动物体一一对应(Identity),然后给出不同物体的运动轨迹。多目标跟踪在智能安防和智能驾驶方向有着重要的应用和需求。许多研究认为简单场景中的多目标跟踪已经取得了较好的效果,但在拥挤场景中,考虑目标运动的复杂性和存在遮挡等问题,多目标跟踪仍然是一个非常具有挑战性的问题。本文主要针对多目标跟踪中的身份交换(ID Sw)和漏检(FN)等问题进行研究,针对这些问题提出相应的算法与模型。本文的主要研究内容如下:1)现有多目标跟踪算法对于目标相似性的计算,通常使用匈牙利算法来实现关联匹配,而匹配时仅仅使用外观相似度作为目标关联匹配的度量,这使得相似对象的识别率较低,容易导致跟踪目标的身份交换。为了解决这一问题,本文在匈牙利算法的基础上提出了一种基于空间约束的成本矩阵优化方法。在关联匹配阶段,利用Kalman滤波估计目标的运动矢量,从而线性预测目标的当前位置。此外,根据估计位置与检测结果的空间关系,通过修改代价矩阵权重的方式,将修改后的成本矩阵用于后续的关联匹配任务,从而使多目标跟踪效果得到提升。2)现有一些研究将单目标跟踪器(SOT)用于多目标跟踪任务取得了较好的效果,但是大部分研究利用注意力网络对原目标特征图权重进行修改,导致SOT跟踪器在初始化特征时容易学到干扰信息。针对上述问题,本文提出直接使用SOT跟踪器对显著特征进行跟踪的方法。该方法能够较大程度去除冗余的信息,将有效信息的占比显著提高,而不用担心初始化时目标被遮挡的问题,而且能够大大降低跟踪过程中的漏检数量。相比之前一些研究使用头部检测网络对全局图像的头部进行检测导致在密集场景中行人头部召回率低的问题,本文提出对单个行人目标使用人体关键点检测网络来计算更加精确的目标头部位置,同时本文还提出了基于目标头部特征的边框回归方法来进一步提升整体目标边界框的稳定性。3)在多目标跟踪中由于卷积形状固定使得在提取目标特征时必定会混淆前景(目标)与背景的问题,基于Point Track的方法可以在一定程度上解决上述问题。然而现有基于Point Track的方法在计算目标的嵌入向量时存在目标外观信息与空间位置信息占比不平衡的问题,本文在此基础上进一步对网络进行改进,在网络中对目标空间信息与目标外观信息进行了平衡。同时本文还对点云的选取方法进行了优化,使之能够更好地反应目标的外观特征。
其他文献
可解释性文档分类旨在对文档进行分类的同时生成解释信息作为模型决策依据。现有基于深度学习的解释方法有效增强了模型的可解释性,取得了显著的成果。但仍存在以下问题:现有方法未能充分考虑文档中单词级、句子级等多个粒度上的文本语义特征;已有模型训练时通过优化变分下界难以精确估计样本分布导致生成文本质量不佳;当前方法对长文本信息进行建模时容易丢失部分长距离依赖特征。本文针对上述问题展开以下三个方面的研究:(1
学位
在需要决策的实际问题中,我们所能获知的信息往往是不确定的、不完整的、且精确度不足。为了解决这类问题,Yang等人提出了基于D-S证据理论的置信规则库推理方法。在此基础上,Liu等人提出了数据驱动的扩展置信规则库的构建方法,它通过对前提属性引入置信分布的方式,进一步提升了规则对于已知知识的表示能力。作为一类模拟专家解决现实问题的专家系统,已经吸引了很多学者对其展开了相关研究。但目前置信规则库仍存在着
学位
大量交通信息的收集使得人们能够高效准确地统计交通流量。这些统计结果对政府决策、区域建设、科学研究起到了重要的数据支撑作用。然而,已有研究表明直接发布统计数据存在严重的个人隐私泄露的风险。如何在发布交通流量数据的同时保证个人隐私的安全性是当前数据库领域的研究热点。作为一种公认的隐私标准,差分隐私提供了严格的隐私安全保证,并被国内外学者广泛研究。针对交通应用场景,本文考虑了差分隐私二维空间数据划分发布
学位
短临强降雨,一般指短时间内降雨强度高的一种强对流天气现象,主要发生在每年的汛期。短临强降雨往往伴有强风,冰雹和雷暴等极端气候现象,容易引起山洪、泥石流、城市洪涝等自然灾害。提高短临强降雨的预测准确度是气象研究人员的重点研究目标之一,但由于短临强降雨的高突发性,气象数据的高维非线性导致传统预测方法效果不佳。而且传统预测方法往往只采用了单方面的气象数据,模型抗干扰性不强,非常依赖于数据的准确性。针对以
学位
文本检测与识别是计算机视觉、模式识别与人工智能领域的热点研究方向。传统的光学字符识别方法对存在变形、噪声、不同结构布局和复杂背景等复杂场景下的文本检测与识别任务表现较差。随着深度学习技术的发展,基于深度学习的文本检测与识别算法在复杂场景下取得了较好效果。然而,相较于英文字符,中文中仅常见字符就多达数千个类别,这使得数据集构建困难;其次,不同于英文文本通常词内字符间距小,词间距大,中文文本字符间距可
学位
深度网络在各种任务上都显示出了强大的力量,被认为是一种潜在的实现通用人工智能的机器学习架构。然而,深度网络学习的典型模式是:给出一组固定的训练数据集,网络通过学习获得任务相关知识,当学习任务完成后,网络就会直接应用到具体的任务中,而不需要再学习新的知识。这种学习模式所建立的模型是静态的,难以适应不断变化的现实任务需求。深度网络迫切需要一种增量学习方法,能够促使模型从连续呈现的数据流中动态地学习新知
学位
论辩挖掘旨在从非结构化的文本中识别论点并对其关系进行分类,是自然语言处理领域的热点研究课题之一。近年来,随着深度学习的不断发展,论辩挖掘领域的相关研究已取得不错的进展,但仍存在诸多挑战:现有工作未充分考虑标注数据稀缺,缺乏对文本结构信息的有效利用,导致了模型难以识别长论点部件;以往方法在进行序列标注时尚不能很好地刻画标签间的长依赖关系;当前的研究在获取文本表示信息时,未能充分利用文本的词汇特征,导
学位
如今,推荐系统已经演变成为能帮助用户做出合理决策的工具。为了给用户提供更有效的推荐,大量的推荐模型已经被提出。在这些模型中,基于内容的推荐模型和基于协同过滤的推荐模型都只注重长期、静态的用户偏好而忽视短期、动态偏好。为了解决上述问题,越来越多的研究开始集中在基于会话的推荐模型。传统的会话推荐算法使用马尔可夫决策过程对会话数据进行建模,但是马尔可夫链无法刻画用户的长期偏好。基于RNN的会话推荐算法能
学位
复杂经济系统理论以动态的、复杂的观点来研究社会经济系统,是一种更全面的、建立在非均衡基础上的经济理论。目前对于复杂经济系统的研究主要是通过仿真的方式进行。但是在传统仿真技术中,系统内经济主体行为是基于给定规则,这就难于解释经济系统中反馈与涌现等现象,因此对复杂经济系统研究的支撑不够。对此,本课题设计了一个多主体的经济系统仿真模型,同时引入深度强化神经网络对系统中的经济主体的行为进行控制。针对经济系
学位
数字微流体生物芯片(Digital Microfluidic Biochip,DMFB)由于其低成本,便携性和高效率等优点,在医疗保健行业中发挥着重要作用。研究学者发现人们对于其安全问题的重视程度远远不及其在市场上的发展程度,其实它与同类芯片产品一样,易受硬件木马等攻击威胁。研究人员已将其遇到的安全问题分为三类:硬件木马、盗版问题、伪造品问题。本文主要通过研究传统芯片安全检测技术,结合生物芯片的特
学位