基于序列蒙特卡洛滤波算法的视觉目标跟踪

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:llt009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像序列的目标跟踪作为计算机视觉领域的一个核心问题,得到了广泛而深入的研究。视觉跟踪研究的主要目的是模仿生理视觉系统的运动感知功能,赋予机器辨识图像序列中物体运动及其相互关系的能力,为图像序列理解提供重要途径。视觉跟踪技术具有广阔的应用前景,如视频监控、视频分析、视频检索、基于视频的运动分析和合成、基于运动信息的身份识别等。经过四十多年尤其是近十年的不懈研究,视觉跟踪技术取得了长足的进步,但实践表明一般意义上的视觉跟踪技术还远未成熟,要开发出真正鲁棒、实用的视觉跟踪应用系统还需要更为鲁棒的核心算法并需要解决大量的算法实现问题。  本文在序列蒙特卡洛滤波算法的框架下,以人脸和人体跟踪为研究对象,针对其中涉及的关键问题进行了探讨,研究了开发鲁棒实用的视觉跟踪系统所需要的核心技术和关键问题解决方案,重点探讨了目标表观建模,复杂运动的建模和推断,融合低端模型和高端模型的运动描述方法等几个关键问题。具体的研究内容如下:  1)提出了可区分性目标表观模型的自适应建模和更新算法。表观建模是视觉跟踪算法性能的决定性因素之一。实践表明:图像特征选择和基于图像特征的目标表观描述模型从根本上决定了算法的鲁棒性和计算复杂性。虽然这一问题得到了领域内学者的极大重视和不懈努力,其仍是阻碍视觉跟踪技术进入实际应用的最困难问题之一。本论文中提出了一种自适应目标表观建模和更新算法。该算法在动态建模过程中不仅考虑目标表观信息,同时对目标所处环境中的背景信息进行考察,从而可对目标/背景的差异信息进行有效建模,在根本上保证了模型具有从变化的背景中区分前景的能力。实验结果表明,相比于目前最具代表性的跟踪算法之一Mean Shift,提出的算法在公开的测试序列上取得了更好的跟踪结果。  2)提出了集成多运动模型的复杂运动建模和推断算法。由于计算复杂性的限制,视觉跟踪算法通常基于局部搜索的策略确定目标的运动状态。所以,根据目标运动规律确定其以较高概率出现的局部区域成为算法效率的关键因素之一。如何针对复杂运动描述目标运动规律,是很多现实跟踪问题的效率瓶颈所在。本论文提出了采用多运动模型对目标复杂运动进行建模和估计的基本框架。在此基础上,针对具有多种运动模式和具有高维运动状态的两类常见的复杂运动模式,将多模型的估计框架融入序列蒙特卡洛滤波算法中,从而针对两类复杂运动问题提出了标准序列蒙特卡洛滤波算法的两个改进:基于多模型切换和基于多模型协同的序列蒙特卡洛滤波算法。在人脸跟踪和面部表情估计问题上分别验证了改进的算法。实验结果表明,相对比于标准序列蒙特卡洛滤波算法,在计算复杂度降低的同时,改进的算法得到了更高的跟踪精度。  3)提出了融合光流和特定模型的面部特征点跟踪算法。面部特征点跟踪是基于特征点的运动感知研究的典型应用,也是基于特征点运动感知任务中的困难问题。现有的面部特征点跟踪方法主要可以分为基于特定描述模型(以下简称模型)和基于光流的方法。本论文在序列蒙特卡洛滤波算法的框架下融合了基于光流和基于特定模型的方法来解决面部特征点跟踪问题,以克服单独采用一类方法的不足,从而达到鲁棒跟踪面部特征点的目的。在基于尺度空间理论改进 KLT光流算法的基础上,以光流估计结果约束基于模型的形变特征点估计的起始搜索位置,大大加速了序列蒙特卡洛滤波算法的搜索过程。对于估计结果中存在的跟踪误差,进一步采用特征点运动轨迹的子空间约束来迭代求精跟踪结果。相比于广泛使用的KLT特征点跟踪算法,实验结果证实了提出算法的有效性。  本论文的三个主要创新点,分别对应视觉跟踪中的两个关键问题:目标表观的建模和目标运动的描述。其中创新点一提出了动态建模前景/背景差异的理念,使其不同于已有的大部分视觉跟踪算法。创新点二和三则分别从显式地采用特定模型描述目标运动和隐式地采用离散特征点描述目标运动方面进行了创新尝试。三种方法互为补充,并适合不同的应用情境。
其他文献
关于《河北省煤炭学会章程》(修改草案)的说明河北煤炭工业局秦文昌各位理事、各位代表:*本会现行的章程是1985年本会二届理事会第一次全体会议通过的,是符合当时实际的。十多年来,作*为
目的 探究分析中医活血化瘀法治疗创伤性骨化性肌炎的临床效果.方法 从我院2018年3月至2019年3月收治的创伤性骨化性肌炎患者中选出68例作为研究对象,同时依据抽签法对其进行
近年来,移动AdHoc网络(MANET,MobileAdHocNetwork)由于其灵活性及实用性受到越来越多的关注,各种AdHoc网络路由协议的提出及相关的各方面性能分析也成为学术界的研究热点。
目的 探讨在对胃癌疾病的手术治疗中,实施腹腔镜根治术治疗对患者应激炎症因子、肠道黏膜功能的影响.方法 选取84例胃癌患者做为研究对象,按随机数字表法实验组(n=42)与对照
目的 分析MRI(核磁共振成像)对膝关节半月板及交叉韧带损伤诊断价值.方法 纳入在我院治疗的60例膝关节半月板及交叉韧带损伤患者,研究时间自2016年10月至2017年10月,回顾性分
刘伯承为新中国的诞生立下了不朽的功勋,但他的女儿刘华北被害事件却鲜为人知;刘华北是怎样被害的?敌人为何在“上党战役”前夕对刘伯承的女儿下毒手? Liu Bocheng made imm
目的 探究尿NAG联合血清CysC检测对2型糖尿病早期肾损伤的诊断意义.方法 选取2型糖尿病肾损伤患者、单纯2型糖尿病患者、健康体检者各50例,分别记为甲组、乙组和丙组,检测并
运动对象的分割和跟踪技术一直是图像处理和计算机视觉领域的重要研究课题。近年来,随着多媒体技术的迅猛发展及计算机性能的不断提高,各种视频图像的应用越来越广泛。视频图像
网格计算是伴随着互联网技术而迅速发展起来的,专门针对复杂科学计算的新型计算模式。网格把整个网络整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源
论文“用PID算法和大林算法设计分级机溢流浓度控制系统”作者李月莹华东地质局金矿事业发展迅速,选矿提金工艺路线已经建立。金矿的选矿自动化呈现较好的发展前景,设计研制磨