论文部分内容阅读
作为新一代的多媒体应用视频编码标准,H.264/AVC采用了许多不同于以往标准的先进技术,在编码效率和性能大幅提高的同时,增强了错误恢复及网络自适应等功能,在广播电视、视频存储与回放、视频会议等领域具有广泛的应用前景。但H.264编码性能的提高是以其计算复杂度的明显增加为代价的。如何在硬件资源有限的嵌入式环境下开发出具有实时编码功能的视频编码器是一项极具挑战性的工作。 TMS320DM642是美国德州仪器公司开发的第二代高性能超长指令字结构的定点DSP处理器,具有8个独立的功能单元和64个32位通用寄存器,在8个功能单元里扩展了专门用于视频/图像处理的指令集,提高了视频处理的性能和指令结构的并行性;在600MHZ的时钟频率下,DM642的峰值处理速度达到4800MIPS(每秒百万条指令);DM642片内采用两级存储器结构,并具有丰富的片上外围接口,如10/100Mbps以太网接口、三个可配置的视频端口、一个64位的外部存储器接口等。DM642的强大处理和接口能力使它非常适合基于IP和无线网络的音视频传输、安全监控等视频/图像处理领域的应用。 本论文主要介绍如何在TMS320DM642硬件开发平台上进行H.264“baseline”编码器的开发与优化。编码器源程序采用三大开源代码之一的x264的编码部分。与官方提供的JM系列测试源码相比,x264编码器摒弃了一些对编码性能贡献微小但计算复杂度极高的新特性,更易于移植和优化。视频编码算法在DSP芯片上的高效实现,必须充分挖掘视频处理器的并行特性和计算资源,才能满足系统实时性的要求。我们在原x264编码器程序基础上主要做了以下几项工作:一是对程序进行裁减、修改并最终移植到DSP平台上运行;二是充分利用DM642的EDMA控制器等对数据传输和存储空间进行优化:三是利用内联函数、线性汇编等对H.264核心算法和程序进行改进,提高代码运行的并行性。最后提出了一个复杂度较低、编码效率较高的嵌入式实时H.264编码器方案。 目前,我们的H.264编码器每秒钟能够完成28~38帧QCIF格式图像的编码。解码后的视频图像具有较高的主观质量和客观质量。