基于深度学习的视觉目标检测与跟踪技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:bqayxgflx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉系统作为许多智能平台的核心组成部分,将在工业4.0、智慧城市、自动驾驶以及军事领域的无人化作战中发挥极其重要的作用。视觉目标检测和跟踪是计算机视觉领域重要的基础任务,也是实现许多高级视觉应用的前提。近年来,随着计算机硬件性能的提升、大数据技术的进步以及深度学习技术的发展,视觉目标检测和跟踪技术取得了较大的进步。然而,由于噪声等诸多因素的影响,现有的视觉目标检测与跟踪技术还不能满足实际的应用需求。因此,本文基于深度学习理论和方法深入研究视觉目标检测与跟踪技术,包括以下几方面工作:(1)基于深度网络的视觉目标检测模型在常规检测场景中具有良好的性能,但将其用于多尺度目标检测时,往往会出现召回率低以及定位精度差的问题。虽然采用传统的多尺度处理手段能提升检测精度,但是会产生过量的计算冗余,导致检测效率低下。因此,本文提出一种基于Faster-RCNN的多尺度目标检测模型,该模型可有效提升小目标和多尺度目标的提议召回率与检测精度。首先,通过定性与定量分析,指出了多尺度目标检测存在的困难,分析了池化操作和目标的多尺度对两阶段检测算法中区域提议过程的影响,提出了一种区域提议网络的改进方案,以提升多尺度目标的提议召回率。其次,针对多尺度目标提出了改进的前景样本生成策略,减少了训练过程中的无效前景样本,使得区域提议网络的训练更加高效。再次,融合多层次特征对提议区域的特征进行增强,有效提升了小目标的识别和定位精度。最后,在实际数据集上验证了改进模型的有效性。(2)基于深度网络的跟踪模型CREST具有较好的跟踪精度与鲁棒性,但是其存在网络模型训练时间长、在线更新效率低以及对硬件设备要求高的问题,限制了该模型的应用范围。对此,本文从两个方面对CREST跟踪模型进行了改进。一方面,从提升运算效率的角度对模型进行改进。首先,分析了网络模型训练和更新效率低的原因,即基网络卷积核尺寸较大,产生了过量的计算,严重影响模型的前向和后向计算。对此,本文将基网络重新定义为显式的相关滤波器,并采用频域参数描述基网络。模型初始训练以及在线更新时,先采用相关滤波算法对基网络进行高效训练,以快速学习目标外观的主要信息,借助频域内的反向传播算法,实现了改进模型的端到端训练。改进后基网络中前向和后向运算都可以利用频域内的加速方法降低运算量,在保持跟踪精度的条件下,提升了跟踪速度、训练速度和在线更新效率。评估数据集上的大量实验验证了改进后模型的性能。另一方面,针对CREST跟踪模型参数规模大,模型运行对计算设备要求高的问题,采用多种轻量化方法对模型进行改进,改进后的模型以较小的跟踪精度代价,获得了运算量和模型参数规模的显著降低,极大地降低了模型运行对硬件设备的要求。(3)在视觉目标跟踪过程中,尤其是在长时跟踪时,往往需要对跟踪结果的置信度进行评估,以分析当前的跟踪状态,并对不同的状态进行处理。当前已有的置信度分析方法通常是基于跟踪器预测的目标位置热图进行评估,这种评估方法存在多方面的问题:一是指标值完全由跟踪结果生成,具有很强的主观性;二是目标被缓慢遮挡时指标易虚高,易导致跟踪的漂移;三是当目标外观发生快速变化时,指标值易虚低,模型将失去更新的机会,从而在后续帧中丢失目标;四是指标值不能直接作为跟踪状态的判据,目标的跟踪状态与指标的变化并没有直接的对应关系,使得利用这些指标判断被遮挡或丢失仍是一个复杂的模式识别问题。对此,本文提出一种对跟踪结果中的目标进行弱监督分割的模型,并基于该模型给了一种客观的置信度评估方法,有效克服了上述的问题。首先,研究了利用弱标注(图像级标签)数据训练语义分割模型的方法,通过对跟踪结果进行分割得到目标的分割掩膜。其次,建立了跟踪结果与目标分割结果的差异性分析模型,并利用该模型评估跟踪结果的置信度。最后,在多种跟踪场景下进行了针对性的实验,结果表明了评估方法的有效性。(4)在视觉目标跟踪应用于实际跟踪场景时,由于环境的复杂性,经常会出现目标被遮挡以及出视野等导致目标丢失的情况。短时跟踪模型通常依赖于目标连续出现在视野中这一假设,因此难以胜任这些场景下的跟踪,以上挑战需要由长时跟踪模型来完成。目前,视觉目标的长时跟踪仍然是一个开放性和具有挑战性的问题。本文对长时跟踪算法进行研究,借鉴TLD框架的思想,并更加重视置信度评估在长时跟踪中的作用,把置信度评估作为长时跟踪中的重要一环,提出了一种基于跟踪-评估-学习-检测框架的长时跟踪方法。首先,给出一种基于全相关滤波的目标重检测算法,该算法可对置信度评估模型的输出资源进行充分利用,有效减少重检测时的计算量,提升检测效率。其次,设计了长时跟踪框架中短时跟踪器、置信度评估模型、重检测器的交互和更新策略,所设计的策略可以有效减少目标“假丢失”的概率,减少重检测的次数。再次,结合前文中对短时跟踪模型的改进,使得目标丢失后跟踪器的重置效率能有效提升。最后,在长时跟踪评估数据集上测试了框架的有效性。(5)基于上述检测与跟踪技术的研究,设计并实现视觉目标检测与跟踪软件。首先介绍视觉目标检测与跟踪软件的总体设计,包括设计概述、需求分析、功能设计以及界面设计。其次,介绍视觉目标检测与跟踪软件中核心模块的详细设计。最后,基于VC++和Matlab混合编程实现了视觉目标检测与跟踪软件。
其他文献
无人值守地面传感器(Unattended Ground Sensors,UGS)系统通常简称为地面传感器系统,是由布放在监测区域地面上的传感器节点、汇聚节点和监控节点所组成的无线监测网络。传感器节点对监测区域的目标信息进行采集、处理,并以无线方式将监测信息上传至汇聚节点,最终上传至远程监控中心。UGS监测系统具有快速部署、使用便捷、成本较低等优点,在战场信息采集及要地监控等领域有广阔的应用前景。但
人脸属性预测在娱乐、安防、社交媒体等实际应用中扮演着重要角色。现有研究多采用分类和回归性能较好的经典机器学习算法对人脸单个属性进行预测,由于单属性预测算法提取的特征较浅,未能挖掘更深层的特征,人脸属性预测准确率难以达到现实应用需求。随着计算机技术的快速发展,深度学习算法能高效地获取与属性相关的浅层和深层特征,能够取得比经典学习算法更好的性能,但由于深度学习算法层数较深,需大量的训练样本,现有的公开
无线传感器网络(Wireless Sensor Network,WSN)具有灵活多变的拓扑结构和对复杂战场环境的强大适应能力,以WSN为搭载平台的精确干扰技术成为新一代电子对抗技术研究核心。然而,其庞大的传感器节点数目也为算法处理时效性带来巨大挑战。针对该问题,本文建立了具有高效运算性能的精确干扰框架并提出了具有分布式运算能力的合作定位算法和精确功率传输算法。具体工作和创新点如下:一、搭建了以分布
本文主要研究自主驾驶汽车的场景感知和局部路径规划这两项关键技术。其中,场景感知由于输入数据的维数较高且包含大量噪声,因此是一项极具挑战的任务。目前的场景感知算法主要利用了计算机视觉和模式识别技术。通过使用机器学习,尤其是深度学习,可大幅提高场景感知的性能。然而,深度学习中所存在的(a)数据需求量大,(b)人工标签需求量大,以及(c)缺乏可解释性这三个问题,却严重地限制了其在场景感知中的应用。为此,
近年来,以深度学习为代表的核心技术引发了第三次人工智能的浪潮。从互联网巨头到中小规模企业、从研究所到各个高校,学术界和工业界都围绕深度学习技术开展了广泛的研究和探索。虽然以TPU为代表的深度学习专用硬件层出不穷,但是GPU集群仍然是开展深度学习研发的主流平台。相比于巨头互联网公司推出的大规模定制化深度学习平台,广大科研院校和中小规模企业由于预算有限,更偏向于采用高性价比的小规模GPU集群,来构建多
城市作为区域经济、政治和文化的中心,城市居民的日常出行需求呈多样化高频次的特点,如通勤、购物、娱乐等。但公共交通拥挤、公共场所人群密集、道路交通拥堵等低出行舒适度的问题也日益突出。当前,多个城市推出实时“拥挤度”、“交通指数”等出行参考指标,城市居民可据此合理选择出行,人流密集管控、道路交通疏导等措施的实施有了较好的针对性。但这些实时监控的出行参考指标,只反映当前而没有预测其即将产生的变化,作用相
判定布尔公式的可满足性(SAT)是计算机科学领域经典的NP完全问题之一,由于众多领域的实际问题都可以转换为布尔可满足问题来求解,例如VLSI设计与验证、软件的形式验证、人工智能规划与优化等领域,因此几十年来一直是计算机理论领域的研究热点。近年来,随着布尔可满足求解技术的不断发展,软件实现的SAT求解器也逐渐走向成熟与完善,但针对某些类型的SAT实例,例如复杂3-SAT实例,存在学习时间长、求解效率
合成孔径雷达在军用领域和民用领域中都发挥着重要的作用。作为合成孔径雷达应用的重要方面,目标识别一直是研究的热点。基于机器学习的合成孔径雷达目标识别方法已经取得了非常优秀的性能。目前的合成孔径雷达目标识别技术都是以完整的目标作为处理对象。实际应用中经常出现遮挡等导致的目标残缺现象。传统的机器学习目标识别技术识别这些遮挡目标的性能会严重恶化。因此需要研究针对合成孔径雷达遮挡目标的目标识别技术。本文重点
数据聚类是最基础和最重要的数据分析手段,实现对海量数据快速智能的聚类分析对于帮助整理、摘要和储存数据具有重要意义。在大数据和人工智能快速发展的背景下,传统聚类算法逐渐不能满足人们的实际需求,基于深度神经网络的聚类方法成为当前领域的热门研究方向。现有的深度聚类算法普遍存在目标函数易退化、泛化能力弱、训练不稳定和无监督神经网络表达性不足等问题。如何设计具有强表达性、泛化性、稳定性的深度聚类算法是人工智
随着城镇化进程的持续推进以及人们生活水平的提高,城市人口和交通出行需求快速增长,失衡的交通供需关系引发了交通拥堵、交通事故、能源浪费等诸多问题。在缓解交通拥堵方面,单纯限制交通出行需求或新建交通基础设施的方法面临日益增大的压力,潜力越来越小。智能交通系统立足科技的进步平衡交通供需,在提升交通系统运行效率,保障交通安全,减少尾气排放等方面发挥着不可替代的作用,是城市交通未来发展的方向。对道路交通系统