视频目标检测及匹配方法研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:njcdst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和数字图像处理技术的迅速发展,基于计算机视觉的智能监控已逐渐应用到公共安全、智能交通、军事、工业检测等领域,而视频中的运动目标检测与跟踪是智能监控研究中最关键的问题之一。通过利用计算机视觉技术对视频进行处理,让计算机真正拥有“看”的本领一直以来都是计算机视觉的目标。本文研究了计算机视觉中的单应矩阵估计问题及运动目标检测与跟踪,主要的工作有:1、如何准确估计单应矩阵仍然是计算机视觉中一个具有挑战性的问题。到目前为止,单应矩阵的估计几乎是在RANSAC框架下进行。而本文给出了一种基于四边形四个点顺序保持约束及相似性测量方法的单应矩阵估计方法。该方法无需在方法RANSAC框架下进行,它不需要重复地估计单应矩阵,并且耗时较少。仿真实验分析了外点比例和噪声水平对单应矩阵估计精度的影响,真实图像实验比较了该方法和其他方法的单应矩阵估计效果。2、针对传统 TLD(Tracking-Learning-Detection)算法消耗时间多,跟踪速度慢,运动目标移动速度快而跟踪不上等问题,本文改进了 TLD算法中的跟踪模块和检测模块。该改进方法根据运动的连续性,让跟踪和检测都在上一帧跟踪目标的邻域进行,并在检测模块中引入HOG特征检测和SVM分类器。并且为了进一步加快算法的运行速度达到实时效果,使用了多核并行编程技术。针对真实足球比赛视频中的足球和运动员,实验中分别验证了改进TLD算法克服遮挡能力和克服目标消失后再次出现重新跟踪的能力以及跟踪快速移动目标的能力。结果表明该改进算法的跟踪正确率、实时性以及鲁棒性都优于传统TLD算法。
其他文献
随着多媒体技术的发展,图像在互联网信息中占有越来越重要的比例。因而,如何快速、有效的管理这些丰富而直观的信息,逐渐成为当前科研人员和技术工作者关注的焦点。分形理论
人脸识别是图像处理、计算机视觉、模式识别等领域研究的热点话题,近些年研究学者提出了许多的经典算法,并广泛应用于公共安全,视频监控。线性判别分析(LDA)和稀疏表示(SRC)
正交频分复用(OFDM)指数调制(IM)是一种典型的多载波调制技术。相比于传统的OFDM,在快时变信道下,OFDM-IM对子载波间干扰(ICI)具有更强的鲁棒性。另外,OFDM-IM能够在不增加调
对话管理(DM:Dialogue Management)在人机对话系统(DS:Dialogue System)中扮演着重要角色。基于马氏决策过程(MDP:Markov Decision Process)的对话管理建模取得了不少进展,但
大庆油田总医院信息系统是应用计算机和计算机网络为医院所属各部门提供病人医疗信息、财务核算信息、行政管理信息和决策统计信息,对这些信息进行收集、存储、处理加工以满
语音不仅是人与人之间信息的沟通的媒介,也携人自身与众不同的特征,同时也具有共性及各自独立的变性等特征。声纹特征是一种生物特征,它包含着说话人生理、物理构造不同的特
在海量数据时代,如何有效处理视频等大规模数据,挖掘有效信息,是目前科学和工程领域亟待解决的问题。非负矩阵分解(Non-negative Matrix Factorization,NMF)作为一种有效的矩阵
云数据中心作为云计算的重要组成部分,已经取代了传统的数据中心,而大规模云数据中心的建设和运转,不仅带来大量的电能消耗和二氧化碳的排放,且资源利用率普遍过低,造成了环
虚拟机不仅提供高效和安全的计算资源容器,而且可以在多个物理主机之间平滑迁移。虚拟机的动态迁移是基于多个虚拟机的环境中的一个强大的管理工具,它已成为促进系统维护、负
在三网融合需求的促进作用下,中国国家新闻出版广电总局提出了下一代广播电视网(Next Generation Broadcasting Network,NGB)的概念,使用有线电视网络实现广播电视网、电信网