论文部分内容阅读
H.264/AVC编码器作为当今高清视频的编码标准,其结构特性非常之复杂,具有多重的预测环节,频率划分的离散余弦变换(DCT)转换环节和量化环传输处理环节。如何解决H.264/AVC编码器计算复杂度的问题,使其能够应用于实时处理中,成为一个国内外的热门课题,它将对高清视频的处理和传输的效率有深刻的影响,本文的课题研究来源于此。
为了使编码器能够适应实时处理的应用,本文我们将选择在视频图像进入编码器前对视频图像进行预处理。
在这个预处理环节中,首先进行图像物件分割,本文将介绍一种基于视频图像纹理,色彩,位移等特征的图像全局移动矢量跟踪的方法,计算出全局矢量,通过全局矢量的反补,再打上不同标签,完成了视频图像物件的分割。
然后应用图像物件分割和人类视觉系统的研究结果,根据视频图像中能够引起人类视觉敏感的特性,提出一种图像中重要区域自动识别的方法,图像重要区域的自动识别是一个能够提供非常强大信息的过程,在编码器量化传输处理环节中,建立一个图像重要区域的识别图能对量化阶的设置有很大的帮助。本文提出的方法将对视频图像中的颜色区域,分割后的物件大小,像素所在的位置区域和分割后的物件的移动速度这四个元素进行分析计算,得出四个相关影响因子,然后将这4个因子综合形成一个重要区域识别图(Importance Map)。而本文将提出四种常用的快速组合方法对四个元素进行组合计算。
对前面选择的四种组合方式,本文的最后一章通过EYE TRACKING EXPERIMENT(眼球跟踪实验)将这四种方法进行对比分析,计算出各自方法与实验结果的correlation coefficient(相关度系数),根据这个系数的大小,从而总结出这四种组合方法的各自优劣和重要区域的识别好坏情况。