论文部分内容阅读
视频分割与特征提取技术是视频分析与检索领域中非常重要而又极富挑战的关键技术。目前绝大多数视频都是以压缩方式进行存储或传输的,H.264/AVG(以下简称H.264)是ITU和ISO/IEC联合制定的新一代视频编码技术标准,已经有越来越多的视频采用H.264编码技术进行压缩。在传统的基于内容的视频分析与检索等应用中,视频分割和特征提取方法都是基于像素域的。随着视频数量的显著增加和视频分辨率的不断提升,基于像素域的视频分析方法在运算资源上受到很大限制,因此越来越多的研究都倾向于直接在压缩域中进行视频分割并提取特征。H.264编码标准提出了许多新的编码工具,这使原有针对MPEG压缩域的算法不能完全适用于在H.264压缩域下的情况。因此,对如何直接利用H.264视频码流中的信息进行精确的视频分割和有效的特征提取这个问题进行深入研究,具有重要的理论意义和应用价值。本文正是在这种研究背景下,展开了基于H.264压缩域的视频分割与特征提取方法的研究。第一章绪论部分首先阐述了选题的意义,然后对国内外研究现状和背景进行综述并作了相应的总结,最后介绍了本课题的主要研究内容和论文章节结构。第二章提出了一种基于H.264宏块码率信息的自适应阈值场景切换检测算法。该算法主要由场景突变检测算法和场景渐变检测算法两部分组成。利用H.264压缩域中帧内编码宏块比特数、帧间编码宏块比特数和Skip模式宏块个数三种信息,采用自适应阈值的方法检测视频场景的变化情况。第三章对H.264压缩域中空间对象分割算法进行了研究,是本文研究的重点。首先提出了一种基于块残差能量图的H.264压缩域背景建模与前景对象分割算法。该算法利用H.264Ⅰ帧的压缩码流中提取的信息生成块残差能量图并对其滤波,再通过混合高斯模型对滤波后的块残差能量图进行背景建模,最终分割出前景对象。同时提出了一种基于动态区域划分的运动对象分割算法。该算法先对视频场景进行动态区域划分与更新,得到运动矢量可靠区域与不可靠区域。然后根据动态区域划分结果和帧间分块方式对原始运动矢量场进行滤波处理,得到可靠的运动矢量场。再分别采用基于Gibbs势能函数和细胞神经网络的方法对运动矢量场进行处理,最终得到运动对象分割结果。第四章提出了一种基于H.264Ⅰ帧帧内预测模式的块边缘模式特征提取算法。结合整型DCT变换系数对帧内预测模式进行处理,得到符合MPEG-7标准的五种块边缘模式特征,并利用该特征进行基于内容的图像检索。第五章提出了一种基于H.264压缩域的视频对象跟踪与轨迹特征提取算法。首先在第三章基于H.264压缩域空间对象分割的基础上,选取运动对象的初始位置。然后采用基于置信区域和运动方向一致性的方法进行运动对象的跟踪,再根据跟踪结果提取运动对象的轨迹特征。最后采用Hausdorff距离衡量轨迹相似性,并通过实验验证该特征的有效性。第六章针对视频监控系统中大量的压缩域视频数据,将本文提出的场景切换检测算法、背景建模与前景对象分割算法,运动对象分割算法,块边缘模式特征提取算法和运动特征提取算法应用到智能化的视频监控检索系统中,建立了基于H.264压缩域的视频检索系统原型。第七章总结了本论文的研究成果,并提出了进一步研究的方向和任务。