基于CUDA的TLD视觉跟踪算法研究

被引量 : 25次 | 上传用户:sky_ywt_2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪是计算机视觉研究的热点问题之一,它与模式识别、机器学习、图像处理和自动控制等众多领域息息相关。视觉跟踪主要包括两部分,目标检测和目标跟踪。其中,目标检测用来提取图像中的前景目标,而目标跟踪用来确定目标在视频序列每一帧中的位置。视觉跟踪技术的应用十分广泛,它在视频监控、医疗诊断、智能交通、人机交互和自动驾驶等方面都发挥着重要作用。TLD是捷克大学的ZdenekKalal提出的一种视觉跟踪算法,适用于单目标长时间跟踪。它结合了传统检测算法和跟踪算法的优点,拥有良好的鲁棒性和较高的准确率。CUDA是用于GPU并行计算开发的统一设备架构体系,有高效的通用计算能力与良好编程易用性。本文对视觉跟踪技术进行了深入研究,改进了TLD视觉跟踪算法,并利用CUDA对其并行加速,设计并实现了基于CUDA的CPU-GPU混合结构视觉跟踪算法——CUDA-TLD算法。具体工作主要包括以下两个方面:对TLD算法的学习模块和检测模块进行了改进。由于TLD算法学习模块在对目标模型更新时缺少限制模型中样本数量的策略,因此模型样本数量在长时间地跟踪过程中不断增大,影响了算法的准确率和实时性。本文对目标模型的样本数量设定了一个阈值,当样本数量达到该阈值时,选择一个代表能力最弱的样本进行替换,保持模型的样本规模,从而提高了算法的准确率和实时性。另外,针对TLD检测模块中最近邻分类器存在检测失败的问题,提出了一种基于孤立点分析的检测方法,将那些属于孤立点的图像片(image patch)分类为背景图像片,对TLD算法中原有的检测模块进行了改进,提高了TLD算法的检测率。基于CUDA对TLD算法并行加速,提出了CUDA-TLD算法。为了提高TLD算法的实时性,通过分析TLD算法各部分的耗时,利用CUDA对耗时较多的检测模块进行并行化,从而提出了基于CUDA的TLD视觉跟踪算法——CUDA-TLD算法。试验结果表明,相比于TLD算法,CUDA-TLD算法在保证准确率不变的情况下有效提升了实时性。对于三种常见分辨率的视频,CUDA-TLD的加速比达到了2.02-2.59,其中对于VGA(640×480)分辨率的视频,CUDA-TLD能把帧速从8.4帧/s提升到18.7帧/s,基本满足了实际应用中的实时性要求。
其他文献
目的:1.调查颌面部间隙感染(maxillofacial space infection,MSI)发生的流行病学特征。2.鉴别MSI高危并发症的可能的危险因素,讨论研究变量与MSI高危并发症的关系。材料和方法:1.
随着高职院校"工学结合"、"项目导向"等人才培养模式改革的推进,对高职院校精品课程建设提出了更高的要求。围绕高职人才培养目标建设以项目为导向,工学结合的精品课程,必将
当前,我国计算机教育健康发展的关键之一,就在于广大计算机教育工作者能否正确认识这个新阶段的新特点,在化学教学中建立多媒体课件设计观念、掌握一些化学多媒体课件设计的
大球盖菇,又有酒红色球盖菇等名称,隶属于球盖菇科,其每个菇团的重量可以达到数公斤重,菌盖形状酷似半球形,半径大致在2.5~15厘米。大球盖菇被采摘之后,其呼吸作用仍然存在,具有比较
<正> 许多国家的小学课本中都有一篇描述贝多芬创作《月光奏鸣曲》的故事。一个夜晚,贝多芬在莱茵河畔漫步,偶然听到一间小屋里传出音乐。他推门进去,发现弹琴者是一位盲女,
交通枢纽地区的重要性不仅体现在交通设施本身上,而且体现在交通枢纽对城市经济发展的带动作用,以及对交通枢纽周边地区的规划与土地开发的影响方面。目前随着京沪和沪杭高速
不等式作为数学领域的一个重要版块,在数学的各个领域都起着十分重要的作用。本文具体讨论了各类不等式的证明方法,并对其应用方面进行了举例说明。
<正>苏恒想调动工作,他在华天商场买了5000元的购物卡送给郝局长。苏恒想,给郝局长送卡的人一定不少,免得混了,他特意在购物卡上用铅笔写上自己的名字。苏恒来到郝局长家,对
期刊
在小学数学教学中,与其说教师在教授知识,不如说教师在培养学生的学习能力。通过培养学生的学习能力,提高学生的学习水平,促进学生的全面发展。因此,本文主要对小学数学自主