论文部分内容阅读
视觉目标跟踪作为计算机视觉的重要研究课题,具有十分重要的科研价值。而其又作为智能监控、运动识别、人机交互等智能化得以实施的基础性技术,在实际应用上也具有非凡的意义。但受光照变化、局部遮挡以及目标形变等因素影响,视觉目标跟踪在实际场景下的效果往往差强人意,从而影响了之后动作识别等更高级任务的实际应用,阻碍了社会智能化的进一步推进。本文为了提高视觉目标跟踪算法针对各类场景的鲁棒性,对视觉目标跟踪算法进行了梳理与分析,并针对基于低秩矩阵表示的视觉目标跟踪算法存在的缺陷,做出了以下三点改进:(1)对算法中的目标特征描述模块进行了扩充。针对低秩矩阵表示的目标描述方法对遮挡目标描述不佳的问题,在使用全局低秩矩阵对目标进行全局描述的基础上加入了基于局部低秩矩阵表示的目标细描述,通过局部系数特征的引入,增强目标描述方法在遮挡等挑战场景下的稳定性。而为了进一步地抑制视觉目标跟踪过程中漂移现象的出现,在全局字典中加入了背景模板,通过对目标模板和背景模板系数的不同处理,增强目标特征描述模块输出特征的可靠性。而对于低秩矩阵表示等模板类描述方法中可能出现的异常值现象,尝试引入了最大池化特征来对系数矩阵进行修正,并得到不错的效果。(2)对目标状态估计模块的粒子权重计算规则进行了重新定义。针对现有算法粒子权重计算规则过于简单不够稳定的缺陷,将粒子的权重细分为了全局权重和局部权重,通过分别度量粒子与目标的全局相似性和局部相似性,实现对粒子与目标相似性的综合判定,从而提高粒子权重的可信度。而针对粒子权重计算受目标遮挡情况影响较大的难题,在局部权重的计算中加入了局部块筛选机制,通过将发生遮挡的局部块排除出局部权重的计算考量范围,降低遮挡情况对粒子与目标相似性度量的影响。(3)对模型参数更新模块中的字典更新策略进行了改进。通过对不同时间的目标模板以不同的概率进行替换更新,降低了较早时间目标模板被替换的概率,从而在保证字典中信息贴近目标最新状态的同时,提高了字典中目标信息的准确性。而为了避免字典中遮挡物信息的引入,在字典更新策略中加入了遮挡判断机制,并通过判断结果对发生遮挡和未发生遮挡两种情况采取不同的字典更新策略,进一步保证了字典中目标信息的准确性。