论文部分内容阅读
H.264是新一代运动图像压缩标准。H.264视频标准(又称为14496-10或MPEG-4 Part10)的制定是由ISO/IEC下属的运动图像专家组MPEG(Moving Picture Experts Group)和ITU下属的视频编码专家组VCEG(Video Coding ExpertGroup)共同成立的联合视频小组JVT(Joint Video Team)在2003年发布的,已经做为一种新型的视频标准被广泛接受。H.264视频标准的优越性是以其复杂度的成倍增加为代价换取的,因此一般的处理器平台已经不能满足H.264高计算复杂度的需求。超长指令字(Very Long Instruction Word,VLIW)结构是近年来微处理器设计结构的热点之一,大部分的DSP厂商都生产基于VLIW的DSP芯片,而该芯片在视频处理领域有着出色的表现。
本文主要研究H.264的快速视频算法,以降低计算复杂度,同时研究基于特定DSP芯片结构的移植和优化内容,以达到嵌入式系统下的实时编解码。
为了降低H.264的编码复杂度,并使H.264更加广泛的应用于DSP领域。本文在分析H.264各个模块的运算复杂度和对编码性能贡献的基础上,对编码模块中比较耗时的运动估计和模式选择这两部分进行了深入研究:针对运动估计提出了一种更为有效的快速算法,即自适应十字型、棱形、六边形快速运动估计算法(Adaptive Cross-Diamond-Hexagonal Search Algorithm,ACDHS);针对模式选择提出了基于纹理的模式选择快速算法。
为了实现不同码流的无缝切换,H.264.增加了SP帧(Switching Predictive-Frame)和SI帧(Switching Intra-Frame)代替I帧(Intra-frame)实现码流的简单切换。SP帧的主要特色是:不同参考帧可以解码出相同的重构帧。因此利用SP帧技术生成的码流,能够在不同码率的码流间进行无缝切换,从而服务器能够根据用户的连接速度提供最好质量的服务。本文首先分析H.264提议的SP帧编解码方案,然后针对编码方案中不合理的地方进行改进,改进的SP帧编解码方案,实现了不同码流之间的无漂移切换。
同时,本文通过研究H.264.标准参考模型JM12.0(Joint Model 12.0)和德州仪器(Texas Instruments,TI)公司的TMS320DM642处理器的结构特点,对H.264算法进行移植和优化。在算法的移植过程中,根据PC机和DSP(Digital SignalProcessor)编译器的不同特点和DSP资源的有限性,采用存储空间分配、改变存取方式和改变变量定义、声明等方法,对H.264标准代码在DSP上做了初步的移植。
算法优化是实现嵌入式下实时编解码的重点。本文借鉴一些嵌入式系统常用编程和优化技巧,采用了调整程序结构、算法实现方式、数据打包技术、调整存储空间分配、内联汇编嵌入和循环内部流水线操作等一系列优化方法对JM12.0整体结构和其中的瓶颈函数做了优化,并取得了较好的实验结果。
论文针对H.264.视频标准提出的快速算法和基于DSP芯片进行的视频算法移植、优化等工作对运动图像编码和基于DSP处理器的实际应用有很高的参考价值,同时对H.264视频标准本身的发展和应用也具有重要意义。