【摘 要】
:
H.264是一种高性能的视频编码方法,但其在运动估计、帧内预测、插值、变换和算术编码等方面具有很高的计算复杂度。根据其内在的并行度,通过分析并行化的瓶颈所在,合理地设计
论文部分内容阅读
H.264是一种高性能的视频编码方法,但其在运动估计、帧内预测、插值、变换和算术编码等方面具有很高的计算复杂度。根据其内在的并行度,通过分析并行化的瓶颈所在,合理地设计与分配任务,并优化对存储器的访问,使其能够在CUDA架构下充分利用GPU资源,从而有效地提高H.264编码器的速度。H.264预测编码的CUDA平台优化主要分为帧间预测编码和帧内预测编码两个部分。针对帧间预测编码中最为复杂、计算量最大的运动估计过程,采用了适合CUDA平台的块层级的并行化算法,将整个H.264运动估计算法分解成五步完成,每一步在维持很低的存储器数据传输量的同时使计算达到高度的并行。实验结果表明,在拥有GPU的协助下,帧间预测编码时间是原来的十四分之一。同时,又充分发掘GPU共享存储器和显存并行传输的特点,进一步在数据读写上优化算法,最终达到了十六倍的加速效果。针对帧内预测过程中相邻块之间的编码依赖性,提出了一种利用原始图像作为预测参考帧的帧内预测算法,这样所有的块都可以在同一时间预测编码,消除了相邻块之间的依赖性。实验结果显示,该算法也达到了十倍以上的加速效果。最后将上述算法在H.264编码器中实现,并且在NVIDIA GTX260 GPU平台上验证所提出的算法,实验结果表明,经过优化的预测编码模块都达到了十几倍的加速效果,同时整个编码器也有近五倍的速度提升,具有明显的优化效果。
其他文献
当前市场主流处理器的发展趋势是多核化/众核化,即通过提高处理器核心数目保持计算性能的持续增长。最新的图形处理器已经能够提高兆级的FLOPS理论峰值,远远超出了市场主流多
随着信息技术广泛应用,用户产生的各种信息越来越多,而数据库作为存储用户数据的场所,存储了大量和用户隐私相关的数据。传统的访问控制因为模型本身存在的弊端,可能导致用户
使用Deep Web集成系统获取隐藏在数据库中的高质量数据成为人们获取信息的重要途径之一。由于Deep Web集成系统查询信息时需从Web上海量的数据源获取信息,因而系统获取信息所
从1988年Morris蠕虫爆发后,互联网一直遭受网络蠕虫的威胁。网络已渗透到国家安全、经济、生活等领域,网络蠕虫对互联网的威胁日益增大。P2P蠕虫利用P2P网络的拓扑结构,可以
近年来,随着计算机应用在不同领域发展的深入,相应的系统要求的差异性也越来越大,这种趋势对于可定制芯片的兴起起到了极大的促进作用。在众多系统芯片开发流程和方法当中,软
随着使用ARM核心处理器作为解决方案的嵌入式智能产品越来越多,基于ARM核心处理器的嵌入式软件调试方法,在开发过程中日益受到人们的关注。ARM公司新近推出的ARM11核心处理器
随着互联网的飞速发展,各种新应用不断涌现,用户数量急剧增加,网络流量呈现爆炸式的增长,网络拥塞问题变得越来越严重。网络发生拥塞会导致吞吐量急剧下降、数据包大量丢失以
随着软件和网络应用的迅速发展,数据库的应用越来越广泛,发挥的作用也越来越重要,数据库管理系统已经成为企业的核心IT系统,大数据量、高并发度也越来越成为企业业务处理系统的首
在网络安全通信问题中,抵御拜占庭攻击越来越受到广大科研究工作者的关注,并且成为当前研究的热点问题。当网络中存在这种攻击时,攻击者不仅想得到一些有用的消息,还想通过多
随着信息科技的快速发展,人类的生活发生了翻天覆地的变化。通过智能科学在生活中的普遍应用,人们可以随时享受智能科学带来的方便和快捷。在智能科学中,最具有代表性的就是机器