论文部分内容阅读
本文首先以信源模型为准则,对低比特率数字视频压缩编码法进行了分类和简要的分析,指出其中的面向对象的低比特率压缩编码方法是一种很有前途的压缩算法。不仅在高压缩比时可有效克服经典图象编码方法中出现的伪轮廓,而且其基于对象的功能,属于最新的MPEG-4标准的重要标志之一。 面向对象的视频压缩算法突破了原有图象编码的信源模型理论框架,基于三维实景模型将图象分割成若干个具有任意形状的对象。每一个对象由三个参数集表示,即运动、形状以及纹理信息,其中运动估计与形状编码为两个最重要的部分。同经典的基于块的匹配技术不同的是,面向对象编码技术中的运动估计应该与景物的对象表示相一致。而且,应该提供对对象运动的可靠估计而不仅仅是一个时间预测。故需引入较复杂的运动模型;而形状编码不仅应该在不明显降低解码图象质量的前提下,实现对象形状的有效编码,而且需为将来的基于对象的可操作性提供便利。因此,面向对象编码中的运动估计模块与形状编码模块值得深入研究,当然,以上两个模块都建立在景物对象的快速及有效生成的基础上。本文正是针对上述这些问题进行了探索和尝试,提出了一些新的算法。 论文的主要成果包括: 提出一种改进的基于二次空间变换的运动补偿,对由空域分割生成的每一个区域进行后向运动估计。用进退法及数值法确定局部最小值等方法,克服原估计在没有足够的纹理信息的2000年土海大学博士学位论文小区域上收敛缓慢或发散的弱点,提高运动估计精度. 提出一种基于二次空间变换运动模型的快速时空分割算法.在上述图象空域分割及区域二次空间变换运动模型参数估计的基础上,通过将非线性的运动模型参数估计问题线性化、Housellolder变换以及求区域相应的R、z矩阵的快速算法等方法,有效地降低运算负载,实现快速时空分割. 提出一种基于六边形网格邻域系以及堆数据结构的最优轮廓图编码方法.以轮廓链为优化编码单位,以最大绝对值距离夫真为约束条件,利用与时空分割结果对应的轮廓链单源有向图的稀疏特性,采用基于堆的数据结构,利用堆排序提取T标号点集中的最小值,有效减少在求单源有向图最短路径问题中通常采用的oijkstra算法的时间复杂度,获得使轮廓图编码码率最低的最优分段线性表示的顶点位置.而且,由于以轮廓链为优化单位,不会破坏原分割图的区域连通性. 对于轮廓链的起始结点,提出了在深度优先遍历搜索过程中,通过在编解码器两端,同时建立动态生成树的方法,使解码端对任何一个轮廓链编码数据进行解码时,其起始结点可从已解码的轮廓链起始结点中选取,如此可有效降低结点编码代价. 提出了基于六边形邻域系的分段线性近似顶点的有效编码方法,使基于六边形邻域系的分段线性近似顶点的编码比特数与通常采用的基于八边形邻域系所需比特数至少相当,证实了能消除轮廓变厚和轮廓点集聚现象的基于六边形邻域系的轮廓表示的有效性.编码的有效性基于分析得出的一下述两个结论:①在具有六边形邻域系的轮廓网中,在已知最优分段线性表示的当前顶点的条件「,下一个顶点相对于当前顶点只有两个可 而向对象的低比特率活动图象压缩编码新算法能的走向.②就同一段折线轮廓而言,如果对其游程长度刀采用扭一l)个。加上最后一个!的编码方式,则基于六边形邻域系的编码方式只比基于八边形邻域系的方式增加一个标志的比特数(l比特) 为解决在前向运动预测中存在的由非均匀间距样本求均匀间距样本这样一个困难的问题,我们引人信号处理中的由非均匀采样恢复连续信号的思想,导出非线性内插算法,使前向运动预测的图象质量与通常采用的后向运动预测的图象质量相当. 提出一种属于面向对象的活动图象压缩编码的方案,在时空分割初始化时,采用后向运动补偿,即以I’为参考帧,对由空域分割生成的I。中的每一个区域进行后向运动估计,生成初始的均匀时空区域,实现从I“帧开始的面向对象的编码,而通常的面向对象的活动图象编码皆从I’帧开始.在后继帧的编码中,以初始时空分割为基础,采用前向运动补偿、非线性内插等算法,跟踪均匀时空区域的时域变化,维持帧间时空分割的一致性.