针对复杂场景的鲁棒跟踪算法研究

来源 :中国科学院大学(中国科学院光电技术研究所) | 被引量 : 0次 | 上传用户:heyouzhang034
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪对计算机视觉具有重要意义,几十年来活跃于智能交通、自动驾驶以及智能家居等范畴。目标跟踪是指在视频序列的首帧给定目标后,跟踪器持续定位后续帧中的目标,建立目标移动轨迹。在现实任务中,面对遮挡、尺度变化、运动模糊等复杂场景,跟踪器极易丢失目标。目前,目标跟踪分为传统目标跟踪算法和基于深度学习的目标跟踪算法。传统目标跟踪算法的优势在于具有良好的实时性,但是它为特定场景设计特征提取方法,这使得它在不同场景下泛化性受限。基于深度学习的目标跟踪算法依靠深度神经网络强大的特征提取能力以及良好的泛化性,在不同场景下都能取得较好的实时跟踪效果,但是存在实时性不足的问题。此外,在长时间目标跟踪的场景下,它们的跟踪效果都不稳定。为此,本文在基于相似性度量跟踪算法的基础上,从获得鲁棒且丰富的目标特征、适应目标运动场景变化的高置信度的目标表示等方面开展研究:1、根据基于相似性度量的跟踪算法跟踪精确度和实时性较高,但在长时间跟踪场景下存在跟踪漂移和尺度适应性差的特点。研究对基线算法SiamFC的特征提取网络和跟踪策略进行分析,在保证实时性的前提下提出了结合特征融合和双模板嵌套更新的孪生网络跟踪算法SiamFC-22。使用深度残差网络ResNet-22深度网络进行目标特征提取,基于其强目标识别能力的深层特征构造语义响应。基于ResNet-22的浅层的高分辨率特征,构造强定位能力的具体结构位置响应;在跟踪策略上,加权融合两个响应并使用双模板嵌套更新机制进行模板更新。经过OTB2015和VOT2016数据集测试,跟踪对快速移动和遮挡等场景更加适应,且跟踪速度为32帧每秒,满足实时性要求。2、为了提升SiamFC-22的尺度适应性与降低跟踪计算量,提出了基于Anchor-Free的跟踪算法UPSiamFC。该算法为了在计算量和特征提取能力之间取得平衡,使用特征融合和注意力机制,设计提出了卷积神经网络AlexNet-UP作为特征提取网络;为了提高跟踪器的尺度适应性,使用Anchor-Free回归网络思想设计了一个预测跟踪框坐标的回归响应;在跟踪策略上,使用基于跟踪框类别估计的模板更新方式进行模板更新。经过OTB2015和VOT2018数据集测试,跟踪器的取得了较好的尺度适应性,同时该算法达到了84帧每秒的速度。3、为了验证UPSiamFC的长时间稳定跟踪效果,选用长时间视频序列数据集UAV20L进行测试。UPSiamFC在实验中取得了0.662的精确度和0.502的成功率,在长时间的复杂场景挑战中仍然能够稳定跟踪。为了验证UPSiamFC在实际工程场景中的跟踪效果,在TX2平台上使用实验室数据集进行测试。实验结果表明,UPSiamFC在TX2平台上能够以46帧每秒的平均速度实时跟踪飞行目标,达到了实际工程的应用需求。综上,针对复杂场景目标跟踪的鲁棒适应与高速实时的要求,从更鲁棒的语义特征、更高分辨率的具象特征、自适应跟踪置信评估与更精确的尺度预测等方面开展了深入研究,提出了基于残差网络的SiamFC-22的目标跟踪算法以及基于Anchor-Free的UPSiamFC的目标跟踪算法,通过公开数据集和实际工程的实验验证,表明提出的算法显著提升了复杂场景下目标稳定跟踪能力,并具有良好的实时性。
其他文献
随着全球化的不断深化,尤其是面对近代以来西方文化霸权扩张长期占据人类历史和世界秩序中心位置的现实境遇,中国需要更加注重文化软实力建设,增强文化自信。《甲骨趣闻》是一本具有文化性质的通俗读物,该书作者以故事形式将甲骨文领域里的奇闻轶事推介给广大读者,向读者介绍甲骨文常识及甲骨文文化。笔者节选其中六篇故事进行翻译实践,旨在向西方国家弘扬中国的甲骨文常识和文化,增强文化自信。在翻译实践中,笔者以目的论作
在社会工作专业实习中,笔者发现所服务的注意缺陷多动障碍儿童全部没有按照医嘱服药,即已有研究中提及的用药依从性低。这在现有研究中是一个普遍现象,既不利于注意缺陷多动障碍儿童的治疗,也在一定程度上影响了社会工作服务的开展。为了深入研究注意缺陷多动障碍儿童的用药依从性低这一问题,本文从注意缺陷多动障碍儿童照顾者的用药决策过程进行分析。笔者深入到注意缺陷多动障碍儿童照顾者的生活情境,探寻影响照顾者的用药决
学位
为探究无膜滴灌棉花的一系列栽培措施,本文于2020年在新疆生产建设兵团第一师水利灌溉试验基地内进行田间试验,密度设置为D1(240000株/hm2)、D2(285000株/hm2)、D3(330000株/hm2)三个梯度,灌水定额设置I1=36 mm、I2=45 mm、I3=54 mm三个梯度,开展了灌水定额和播种密度对无膜滴灌棉花的生长发育、生理生态、土壤水盐运移等方面的研究,同时采用AquaC
太阳能集热器是将能流密度低、波动不连续的太阳辐射能加以收集、转化和利用,根据集热工质的不同,集热器可分为太阳能热水集热器和太阳能空气集热器。而空气集热器具有结构简单、密封要求低、不需要防冻等优点,但也存在集热效率低,热损失大等缺点,如加以性能改进则有可能成为一种高效的集热方式。收集面、集热板作为太阳能空气集热器的核心部件,其性能直接影响集热器集热量大小、集热效率高低。而在集热板表面人为加工一定的粗
在当今社会,艺术早已成为当下社会生活中必不可少的文化交流媒介。美育作为传达艺术的重要途径,更是平衡着人们的精神与智慧。而在美育体系中,儿童美术教育占据了至关重要的地位,在儿童美育课程中,艺术创作的思考和操作过程既有利于儿童抽象思维的形成、发展和强化,也提高了儿童在表达过程中独立解决问题的能力,促进儿童全面发展。本文通过对具体案例的剖析研究,以游戏空间为背景,归纳出儿童美术教育中的“游戏性”原则,并
学位
分布式语义信息集成的关键是本体映射,目前本体映射相关理论研究众多,但语义融合能力依然不足,只停留在静态权值分配的方式。针对该问题,本文提出了基于多策略的本体映射方法,采用动态权值分配的方式,解决该问题。首先,本文的数据来源为Web查询、历史映射信息和语义词典三个方面,根据每个维度需要的时间成本和空间成本,调整数据来源并把相似度高的映射结果存储下来,作为下一次本体映射的输入参考向量。其次在相似度计算
空间红外望远镜系统具有全天时被动工作、抗干扰性强的独特优势,在军事、灾害预警监测等方面发挥着越来越重要的作用。随着探测要求的不断提升,提高空间红外望远镜的分辨率以获取目标更多、更细节的信息则成为了它的一个重点发展方向。增大系统口径是实现高分辨率最为有效的途径之一,但随着口径的不断增大,传统反射式空间红外望远镜系统的重量、体积、研制难度、成本等都会极大的增加,难以满足未来空间红外望远镜系统轻量化、高
2013年,我国《公司法》修改将实缴资本制变为认缴资本制,放宽公司在设立阶段的门槛要求,但与之相关的资本制度却没有改变,就我国公司减资制度而言,从1999年《公司法》再到现行《公司法》,法律对减资的程序要求基本没有调整,唯一变化是现行《公司法》删除了原《公司法》第178条第3款关于最低注册资本额的规定,可见,我国公司减资制度依然遵循着1993年实缴资本制下的程序要求,这与当前认缴资本制的立法背景不
淀粉作为重要的原辅料和食品添加剂,在食品工业中具有广泛的应用。然而淀粉本身糊化困难,易回生等缺陷使其在日常生产中的应用受到了一定的限制。淀粉与多糖的复配体系,通常以表现出黏度升高、回生速率降低,凝胶质构更柔软等一系列更加优越于原淀粉的性质,可被应用到淀粉基食品工业中以改善产品品质。皂荚糖胶是从我国特有的皂荚树果实中提取出来的一种多糖,我国的食品添加剂使用标准GB2760中规定,皂荚糖胶可用于调味料
全方位的钻井水溶开采活动引起的动态变形严重威胁着岩盐矿山基础设施和当地居民的生命财产安全。此外,岩盐矿的持续开采很容易导致地下岩层和水系统的力学变化,造成卤水外泄污染环境。因此,对岩盐矿山进行长期的时空变形监测显得尤为重要。多时相干涉合成孔径雷达技术(Multi-Temporal Interferometric Synthetic Aperture Radar,MT-InSAR)是近年来发展起来的