论文部分内容阅读
随着网络带宽的不断增大和微处理器处理速度的迅速提高,视频通信技术上的问题已经基本得到解决。但是仍然面临进一步降低设备成本和提高系统性能的问题。H.323是现有多媒体视频通信最为成熟的系统标准,也同样面临上述困扰。多点会议中,分屏同时显示是一种比较理想的会议模式。在此会议模式下,需要对与会者的多路视频信号在多点处理单元MCU(或多点处理器MP)上进行合并,然后再将一路单一视频信号发送给其他的与会者。在MCU(或多点处理器MP)上进行码流合并有2种方法,即像素域(pixel-domain)合并方法和编码域(coded-domain)合并方法。
本文在已有研究的基础上,提出了针对H.261、H.263Baseline以及H.263+和H.263++各选项的编码域合并方法。编码域合并是指不需要将各路输入的视频码流解码,直接对码流的数据进行相应处理,再重新组合成符合语法规范的标准码流。编码域的合并方法有效地克服了像素域方法的主要缺点。本文的讨论仅限于4路合为一路的情形。H.261因为其码流的语法结构简单,合并时只需考虑各码流的帧率同步问题。H.263Baseline合并时需要将两个GOB连接成一个CIFGOB,所以除帧率同步外还必须解决量化步长和运动矢量的不一致问题。
到H.263+(1998)为止,H.263的可选模式已经有16种之多。本文参照H.263AnnexX和附录Ⅱ的规定,结合实际使用的情况,选择了6种常用的可选模式,分别详细的分析了这些可选模式的特点,指出了在编码域进行合并时会出现的问题,并提出了解决方案。
本文还提出了一种修改H.263码流语法的建议,使得以非常小的代价换取了编码域码流合并的极大便利。
本文的主要创新在于(1)以基于类的方法分别实现了H.261和H.263Baseline的编码域视频流合并器;(2)分析了H.263+(1998)六种常用可选模式,提出了编码域合并的解决方案;(3)提出了一种修改H.263语法的建议,方便码流合并。