论文部分内容阅读
视频信息应用越来越广泛,其典型代表如网上购物、视频网站、视频点播以及数字图书馆等。其中关键技术主要集中在压缩、传输、管理、控制和检索等方面。由于视频信息信息量大,内容丰富,使得对其进行有效的管理和检索成为一个困难而又必须解决的课题。对于视频的管理和检索目前主要体现在基于视频文件和其描述方面,不能从视频文件内部进行操作,也就是无法基于视频的实际内容进行处理,而这往往又是用户所关心的。因此就引发了视频处理的一个新领域:基于内容的视频分析,又称之为“视频理解”。本文围绕这一领域作了以下工作: 1 视频分析的困难起因在于视频数据没有一个清晰的结构,属于非结构化的数据。因此对视频建立一个合理的结构模型对于视频分析而言,是非常有必要的。本文首先分析了现有的视频模型的特点,并结合MPEG7标准针对通用视频提出了一种较为适用的视频模型,后续的工作也是在该模型基础之上展开的。 2 镜头检测是基于内容的视频分析的首要工作,本章研究了镜头变换的各种类型及其表现,分析了现有的像素域和压缩域镜头检测算法的优劣,并介绍了一种基于边缘特征的镜头检测算法。文中基于双重比较法和抽取帧法提出了一种改进的算法,可以更好的解决渐变起始点的定位问题;在进一步考虑噪声和运动影响的情况下,同时考虑了多数算法中未涉及的帧移位和亮度增强,提出了一种对视频平移和亮度增强具有一定适应性的特征分析算法用于镜头检测。 3 视频段检索是用户的基本需求,属于视频检索的后期工作,这一任务需要基于内容的前期分析,如镜头检测和特征提取等,而这些内容目前研究效果不甚理想,使得对于视频段的检索任务变得困难。本文根据现有的一些方法分析了基于视频段的各种检索模式。并对其中基于关键帧的检索中关键帧的提取提出了一种局部“镜头”检测的方法,使得关键帧更具有代表性。最后根据电视视频信号特点以及视频内容分析的发展水平,提出了适合于电视广告段的检测算法。 4 设计并实现了一个镜头及广告段实时检测实验系统,该系统是在上述算法原理的支持下的实现,是对文中所提算法的验证。