论文部分内容阅读
近年来,随着计算机和网络通信等技术的高速发展,Internet上的信息种类和数量与日俱增。大规模的基于内容的近似重复视频检索正变得越来越重要。很多方法已经被提出来去解决这个问题,但是它们主要集中在提高准确率上,而在大规模网络视频数据库的检索和实时检索方面性能一般。基于这种情况本文将研究重点主要放在对检索速度和准确率有重要影响的特征提取和数据库索引技术的研究上,以达到在大规模网络视频数据库中近似重复视频的实时检索。在视频索引关键技术概述中。视频数据是非结构化的数据,不同于文本等结构化的数据。这里从颜色特性、纹理特性、形状特性和区域目标等方面介绍视频数据。接着对视频索引技术进行概述。介绍了视频特征索引的相关概念和描述、基本的索引结构、索引模型等。其次,描述了视频特征提取和视频索引技术研究。这里提出了次序特征的提取方法,并引入了LBP(local binary pattern)模式,对次序特征做了进一步处理,将关键帧分成主区域和辅区域两个部分。主区域包含了关键帧的主要信息并且相对于辅区域不容易被污染。使得基于LBP的次序特征提取方法不但对颜色变化有很好的鲁棒性而且包含了视频特有的时间特性,视频的时间特性通过取某个关键帧后面的两个关键帧的主区域特征来实现。然后介绍了文本索引中表现优良的倒排索引方法,并结合直方图交集核心(histogramintersection kernel)把这种方法引入到视频索引中。最后利用快速直方图交集(fasthistogram intersection)的思想改进倒排索引的结构,这样减少了查询的对比操作,虽然总的时间数据量级没有提升,但是消耗的时间有一定的提升。系统实现部分,先介绍系统的整体架构,然后分别阐述了关键帧提取、特征提取、视频索引、查询等模块的实现方法和具体实现细节。最后,实验部分。为了实验这个系统的性能,在一个公开的网络视频库CC_WEB_VIDEO中(一万个视频左右)评估这个系统。在相同召回率的情况下比较几个典型算法和本文算法的准确率,并且从平均准确率,速度,存储消耗等方面比较几种算法。因为大规模视频数据库的建立是很困难的,所以这里只从理论上分析了百万级别的视频数据库中内存的消耗和在普遍的硬件条件下(1G内存)此近似重复视频检索系统的可能性。用本文提出的方法实现的系统,在同一个开放网络视频数据库中无论是准确率和速度都要好于其他几种方法,并且时间上可以达到实时的效果。