基于孪生深度网络与元学习的视觉目标跟踪算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhoufuhai5933
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能的发展异常迅猛,作为视频与图像序列智能化分析处理的最重要方式之一,视觉目标跟踪逐渐成为了计算机视觉领域中一大热门研究方向,在诸如交通监管、无人驾驶、智能导航、人机交互甚至军事领域等大量场景下均拥有广阔的发展与应用前景。由于自然拍摄环境下存在诸多干扰,目标跟踪算法面临包括形变、旋转、被遮挡、尺度变换、光照变化、运动模糊、相似物体干扰等各种困难与挑战。本文基于孪生结构的卷积神经网络构建的视觉目标跟踪算法模型,利用基于元学习梯度下降的训练优化方法,提高了跟踪模型在面临自然场景各类干扰挑战时跟踪的精确度与鲁棒性,并结合视频文字跟踪任务,针对其难点做出相应改进,实现跟踪模型在文本场景中的应用。本文主要贡献包括以下几点:1、在目前孪生网络跟踪模型基础上,提出了一种新的基于元学习梯度更新的目标跟踪算法,通过对回归分支的卷积核参数的内部优化,充分利用模板帧目标坐标监督信息,使得跟踪模型可以更准确地拟合目标位置坐标。2、采用了模型无关元学习法的训练方案对参数进行更新,得到的模型在面对新的跟踪视频时仅通过对第一帧图像的一次或少量几次梯度下降,就得到能够适应当前视频的最优模型参数,实现对当前视频良好的目标跟踪效果。3、根据文本视频场景的特点与文字目标表征的特殊性,对目标跟踪模型进行了有针对性的定制化改进,包括文字特征强化、坐标框分割注意力机制、在线模板更新等,实现了视觉目标跟踪算法在文本场景中的应用,对目标跟踪与文字跟踪两者相关领域的研究都具有一定推动作用。
其他文献
当事人意思自治原则在经过几个世纪的理论争议研究和实践论证之后,已经发展为国际合同领域的基本和核心原则。虽然除少部分地区不认可当事人意思自治原则以外,在大多数国家国
引进海外战略投资者重组的失败让深发展错失良机,重新寻找似乎又成了惟一出路  4月15日,深圳发展银行(000001.SZ)公布了其2003年年报,这是5家上市的股份制银行中最后一份被披露的年报。深发展的各项经营指标和财务指标在5家上市银行中都列倒数第一。  同一天,中诚信国际信用评级有限公司发布了2004年中国银行业展望及评级。在这一评级中,深发展的综合财务实力评级为BBB+,在5家上市银行中居倒
新疆旅游纪念品有着鲜明的地域和民族特色,但是消费额较少,没有充分发挥对目的地旅游收入的贡献。为了解旅游者消费行为,本文运用问卷调查的方法,通过SPSS11.5统计软件的因子
尽管拥有北京奥运会IT全球合作伙伴这样的显赫身份,源讯却总是像一尾隐没于水草背后的热带鱼。进入中国整整15年了,这家以提供IT服务为主业的公司2007年底才开通了中文网站。将要过去的奥运年里,源讯有过一次沉默的公开亮相,随后便又潜入水底。没有冠名,没有宣传,人们甚至要怀疑源讯是北京奥运赞助企业中投入回报率最低的一个。  事实上,源讯为了2008年这次“沉默的亮相”,付出的投资远远超过其他奥运赞助商