论文部分内容阅读
随着数字媒体行业的飞速发展和大数据时代的来临,视频数据正以爆炸式的速度急剧增长,如何在海量的数字视频中准确地找到感兴趣的视频片段已成为行业的迫切需求与巨大挑战。视频摘要是对原始视频内容的一个高度浓缩,是解决这一问题的有效手段,它已成为当前数字视频技术的一个热点和难点。本文首先阐述了视频摘要的基本理论,对视频的时空冗余结构进行了分析。在此基础上,对基于对象的视频摘要算法中的背景建模、运动目标检测与跟踪、轨迹组合等核心技术进行了深入探讨。并针对其中存在的缺点提出了一种基于视频分段及转移映射能量函数的视频摘要生成算法。针对原始视频中的时间冗余,本文提出了视频分段的概念,利用混合高斯背景建模方法描述了视频的运动特性,将视频片段分割-合并为静止视频段落、摘要基本段及目标密集段,然后分别处理。在消除了视频的时间冗余的同时,解决了传统视频摘要方法对于目标密集段落的不适应性。针对原始视频中的空间冗余,本文提出了一种基于轨迹提取与轨迹组合的摘要视频生成方法。首先利用基于MSPF的多目标跟踪算法完成对象的轨迹提取,将原始视频以―帧‖为单位的基本结构改变为以―对象‖为单位的基本结构,然后通过求解转移映射函数的最优解将对象的轨迹进行重组,去除原始视频中的时空冗余,生成摘要视频。本文所研究的基于对象轨迹的动态视频摘要生成算法是面向监控视频的,在浓缩过程中能解决传统动态视频摘要算法中丢失监控视频中的隐形相关的重要信息的问题,且最大化去除视频中的时空冗余量,达到较大的视频浓缩比。同时,该算法为后续上层语义搜索技术研究奠定了基础。