论文部分内容阅读
随着大量视频数据的出现,视频管理、视频检索等技术成为研究热点。基于内容的视频检索系统包含对视频的结构化分析,对描述视频内容的特征提取,按照特征进行相似性匹配,以及设计用户界面以提供用户进行视频检索四个主要部分。本文针对视频特征提取,特征匹配,用户界面设计等关键技术展开研究。根据对已有视频特征的综合比较与分析,本文采用已被MPEG-7标准接纳的视频指纹作为表征视频内容的特征。视频指纹描述方法不仅具有提取算法简单、存储数据量小等特点,而且基于视频指纹的检索算法具有定位准确,检索效率高,且适用范围广泛等优点。虽然原有的基于视频指纹的方法可以处理很多情况,但是该方法对于视频传输过程中信道噪声带来的大范围亮度漂移和强干扰容易发漏检,对于实际应用中经过编辑的视频容易产生漏检或误检。
本文主要的贡献是针对视频指纹存在的缺陷,提出了一种改进的视频指纹描述方法,设计了新的相似性匹配算法,并实现了一个基于视频指纹特征的视频内容检索系统。
在视频内容描述方面,在原有视频指纹提出算法的基础上,进一步探讨了在限定数据量的情况下如何定义视频指纹的分割方案以便充分保留原始视频中的信息。根据信息论原理,对视频指纹提取算法进行改进,提出了一种新的利用信息增益来自动选择视频分割方案的视频指纹自适应改进算法,用以解决视频指纹提取依赖于手动确定关键参数的问题,进一步提高视频指纹的计算效率。
在相似性匹配方面,采用比对视频指纹变化量的方法,取代比较视频指纹本身,来消除由于视频处理及传输信道噪声引起的亮度漂移的影响。此外,特别增加了异常因子用于减弱突变干扰的影响。同时,还采用隔行扫描的方法来提高算法的执行效率;本文进一步通过对获取的特征数据进行分析,针对在测试数据集中检索指定视频片断这一特点,提出了一种新的视频匹配算法。该算法运行效率高,能适应于传输信道中存在噪声干扰以及视频编辑所造成的相同内容视频具有不同时间跨度的干扰情况,例如:常见的慢镜头等情况。通过对视频数据库的中大量的实验数据的测试,实验结果证明了这些算法有效性;最后本文讨论了一个实际的视频检索系统设计的关键技术并给出了具体的实现过程。