论文部分内容阅读
目标跟踪是计算机视觉领域的一块重点内容。随着其它支撑类学科的发展,目标跟踪算法也在不断进步当中。传统的目标跟踪算法往往是通过对目标运动趋势的估计来实现对非快速运动目标的跟踪。也就是根据前一帧图像中目标的位置,利用相邻帧间目标位移缓慢的特性来进行跟踪的算法,笔者在文中称其为利用时间相关性的跟踪算法。由于这种跟踪算法无法解决目标消失再出现时的二次跟踪问题,计算机视觉跟踪领域的学者们开始利用检测来代替预估计进行目标检测类跟踪。这类跟踪算法主要利用了目标前景和背景的空间特性,提取特征,训练分类器进行检测识别,从而实现对目标的跟踪。笔者将这类算法称为利用空间相关性的算法。近几年,在目标跟踪方面出现了一种新的跟踪算法——TLD跟踪算法。它同时利用了时间相关性和空间相关性,设计出了一种可适应长期在线学习更新样本的学习机制P-N Learning。在这种学习机制的帮助下,结合传统的运动估计和图像检测两类跟踪算法设计出一种更加贴近人类跟踪行为的跟踪算法。该算法如果应用到人脸识别领域,可以在一定程度上提高人脸识别系统的精度,减轻人脸识别系统的硬件负载。将原来人脸识别系统中常用的逐帧识别策略替代为跟踪加识别的策略,从而达到改善原有系统的目的。因此,本文设计出一种基于TLD框架的人脸跟踪算法并将该算法应用到人脸识别领域。本文首先介绍了 TLD算法中用到的相关理论知识,其中包括LK光流跟踪算法、视频检测相关理论和P-N Learning学习算法。在第三章,本文主要介绍了在TLD跟踪算法的框架下用于进行人脸检测的两种分类算法的设计与实现。同时也论述了两种分类算法相关的网格生成模块和特征提取模块的实现方法。随机蕨丛分类器是一种随机森林分类器的变形分类器,它具有快速训练和鲁棒性强的特点,在学习过程中,随机蕨丛分类器不会因为样本更新而占用额外存储资源,因此很适合用于在线学习的跟踪算法。最近邻分类器配合TLD算法中的相似度计算方法和在线学习更新样本的策略有出色地识别能力,因此被选中作为TLD算法中最后一级分类器。在第四章,本文首先概述了基于TLD框架的人脸跟踪算法整体框架结构。之后详细论述了人脸跟踪算法的工作原理、融合决策模块的设计与决策方法。本文在第四章还论述了 TLD跟踪算法中跟踪模块、检测模块、学习模块的设计原理和实现方法。在实验结果与分析一章中,论文分别介绍了基于TLD框架的人脸跟踪算法在单独使用跟踪模块、跟踪与检测模块、完整算法三种情况下对同一视频跟踪效果,并分析学习模块在整个算法中的重要作用。对人脸跟踪算法进行鲁棒性测试,通过测试该算法在遮挡、消失再现、相似目标干扰等情况下的跟踪效果理论分析,说明TLD框架是一种适用与人脸跟踪的跟踪算法框架,本文实现的人脸跟踪算法是一种适合应用到人脸识别领域的跟踪算法。在总结与展望中本文分析了目前本算法的不足之处,例如在目标进行快速形变情况下的跟踪效果较差,算法时间复杂度过大无法实现实时跟踪等问题。在最后,论文根据前文论述的内容,提出相应研究方向和可能的解决办法等。