论文部分内容阅读
本文主要针对直接影响视频检索结果的两个关键技术:视频特征提取和相似性匹配算法展开研究。
在MPEG-7的视频描述符的基础上,提出了一种新的视频特征——视频时序特征的概念,并设计和采用了相应的特征提取方法和相似性匹配算法,为基于时一空信息的视频检索的进一步研究提供了良好的试验平台。主要工作包括以下几个方面:
提出了一种新的视频描述特征——视频时序特征,有效地利用了视频的时间一空间信息,用视频空间特征随时间的变化表征视频内容,具有提取算法简单、视频特征数据量小等特点。
设计并实现了基于熵的视频帧分割算法和利用图论中位点的最优分割点选取算法,用以增加视频时序特征的信息量。首先对视频帧进行区域分割,分割成小的子区域,分别提取每个子区域的视频特征。由于视频帧分割直接影响检索结果和运行速度,因此采用基于信息熵原理的视频帧区域分割算法。并且,通过对某类视频(例如广告,新闻等)进行大量实验,将视频帧分割结果进行统计分析,利用图论中位点理论,确定针对某一类型视频的最佳分割方式,提高算法整体检索速度。
针对常见干扰,设计并实现了相似性匹配算法。针对亮度整体漂移和突变干扰等常见干扰,采用梯度匹配和异常因子增加算法的鲁棒性,并采用动态时间规划匹配算法解决由于视频再编辑引起的不同时间尺度问题。试验结果证明本算法具有很好的查全率和准确度。