基于深度强化学习的视觉追踪算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:JK0803_zengyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体追踪是计算机视觉领域非常重要的研究方向,近年来备受研究者们的关注和青睐。视觉追踪是对视频第一帧图像中需要跟踪的物体进行标注,在后续的图像中标记出待追踪物体的位置和对应的边框。近年来基于卷积神经网络的视觉追踪算法取得了突破性的进展,但是这种方法仅提取图像的局部为特征,并没有考虑到不同图像中追踪物体位置之间的依赖关系。本文提出使用递归网络学习不同序列之间的依赖关系,同时使用卷积网络预测不同状态下每个动作的执行概率,使用策略梯度算法优化目标函数,提出了基于深度强化学习的视觉追踪算法。强化学习旨在构造一个马尔科夫决策过程,学习状态和动作之间的映射关系,将视觉追踪任务定义为马尔科夫决策过程,当前的物体在不同的时刻下通过一系列的动作得到待追踪物体的位置。长短记忆模型通过当前的输入和上一时刻隐含的状态输出作为网络的输入去学习不同序列的依赖关系。本文在介绍了基于深度学习的卷积神经网络和强化学习的策略梯度算法的基础上,深入分析了经典的深度学习的视觉追踪算法,并提出了基于深度强化学习的视觉追踪方法,经过实验对比分析,本文所提出的方法能够运用到实际的环境中并且提升了追踪效率。
其他文献
<正>~~
根据2013年3—11月对长江口东滩潮间带湿地鱼类群落的监测数据,分析了该区域鱼类群落物种组成和丰度的季节变化。研究共采集到鱼类39种,隶属20科。结果表明,种类最多的科是虾虎
<正>日语中的"奥"意为穿透多层的空间,代表着抽象、深邃、向内收、极难到达、极深的事物。在日本建筑传统中,"奥"指的是隐藏在建筑内部最深处的空间。这次的竞赛,我尝试将涩
总结了目前我国学校心理学发展的现状:青少年心理健康教育和学校心理学学科建设取得了一定成果;但其概念尚未十分清晰,理论发展尚不成熟;实践工作尚未完全正规化,系统化。对
环境警察制度的设立不仅能够缓解当前环境执法羸弱的困境,也能够对环境犯罪进行有效的打击。但是,我国当下试行的环境警察制度还存在执法无依据、编制无保障、专业性不强等诸
介绍了一种二阶巴特沃斯差分方程的计算方法和基于瞬时无功理论的三相锁相环,并提出了一种改进的单相低通锁相环算法。利用Matlab软件和TMS2812 DSP数字信号处理器对工频、幅
实现国有企业的重新定位和分类、完善国有资产的监督管理体系以及建立起相互补充的资本运营机制是国有企业混合所有制改革的主要目的。但是,国有经济在社会主义市场经济中的
突发性重大灾害发生后对经济的危害和影响是多角度、多层面的,如何根据其经济危害性质实现不完全信息下的科学评价成为关键问题。文章从重大灾害经济损失构成与计量方法出发,综
近年来,计算机互联网技术发展迅速,且为推动我国现代化建设做出了较大的贡献。作为计算机软件的一种最为重要的语言,C语言不仅充当着一切语言的基础来辅助计算机功能的完成,
后浇带施工技术是现浇钢筋混凝土结构施工中应用较为广泛的技术,在改善结构裂缝问题,提升结构稳定性、可靠性,强化建筑工程项目施工质量上存在积极影响。基于此,本文以房屋建