基于H.264的快速运动估计算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:qiuxiang8288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264是ITU-TVCEG和ISO/IEC MPEG联合制定的最新的国际视频编解码标准,相比以往的标准,H.264具有低码率、高画质、高压缩比等特点,但在提高编码效率的同时,计算复杂度也提高了几倍甚至十几倍。在H.264中,运动估计是视频编码最为关键技术之一,也是制约视频实时编码的瓶颈。据统计,采用多参考帧及所有分块模式的运动估计占整个H.264编码器计算量的85%以上,采用单参考帧的运动估计也至少占整个编码器计算量的60%以上,因此研究基于H.264的快速运动估计算法有着重要的意义。   本研究主要内容包括:⑴介绍了H.264/AVC标准的编解码框架,然后对其主要技术特点如帧内预测、帧间预测、可变块大小运动估计、多帧参考等进行了分析,同时在此基础上对全搜索法、三步搜索法、新三步搜索法、基于块的梯度下降搜索法、四步法、菱形搜索法、六边形算法等经典算法进行了分析总结。⑵针对目前最为优秀的运动估计算法之一非对称十字型多层次六边形搜索算法UMHexagonS提出了两种改进方案。在高效的起始点预测之后,通过引入自适应的终止搜索因子,实现对不同尺寸静止宏块的判断,减少了陷入搜索冗余的可能。同时针对UMHexagonS中采用的静态搜索长度,提出使用改进的动态搜索窗口,对搜索窗口的长度进行动态调节。实验结果表明,本文提出的改进方案与UMHexagonS相比,在基本不影响视频质量的情况下,平均减少了约21.21%的运动估计时耗。⑶提出了一种新的基于搜索模式自适应的快速运动估计算法。该算法首先通过运动矢量之间的时空相关性对搜索起始点进行准确的预测,然后对相邻宏块之间的相关性进行判断,根据不同的宏块类型自适应选择不同的搜索模板和搜索策略,对于运动非常剧烈的宏块采用改进的偏水平十字形模板,对于较剧烈的宏块,根据当前块尺寸选择具有方向偏置性的水平、垂直扁六边形完成搜索,对于小运动宏块采用风筝形模板(KSP)完成精确定位;最后选取不同运动类型的多组视频序列对提出的算法进行了实验,验证了本文算法的可行性、有效性、稳定性。
其他文献
作为分布式系统建模和分析工具,Petri网的应用领域越来越广泛。Petri网的变迁引发序列反映了Petri网的运行特征,一个Petri网产生的语言可以理解为由Petri网接受的所有变迁发
在互联网技术飞速发展的今天,网络已成为人们日常生活中所不可或缺的工具。随着网络信息的海量增长,如何有效且快速的从中找寻自己所需要的信息已成为目前研究的热点,因此网页分
图像融合就是通过一定的算法将两幅或是多幅图像融合成为一幅新图像。多尺度分解源于计算机视觉研究中对人眼感知过程的模拟,具有良好的频域局部特性,所以,它被广泛的应用于
随着社会的发展,人们收集了越来越多的数据。但往往它们会有部分缺失、含有噪音等问题。可是传统的频繁项集挖掘算法已不再适用这种不确定性数据的挖掘。所以,我们需要新的算
双语句对的专业分类具体来说就是对句库中对齐的双语句对进行专业分类,属于短文本分类范畴。传统的文本分类方法基本都是处理普通文本(长文本)分类,目前短文本分类技术还不成
面对服务的体系架构(Service-Oriented Architecture,SOA)是分布式计算和软件开发的最新发展方向,Web服务作为SOA的实现方式之一,其价值在于解决与客户无关的服务重用,Web服
互联网经济正在发生日新月异的改变,人们的关注点也从原来的门户和网站流量变为更为复杂的自动化电子交易。一种新的Web计算方式——Web服务也应运而生。作为新一代的Web技术
基于视频的人体行为识别在人机交互、视频分析和社会公共安全等应用中具有广泛的发展前景与潜在的商业价值,使得它成为计算机视觉领域的一个热点话题。人体行为识别的主要任
板球系统是球杆系统在平面空间的二维拓展,是一种具有强耦合性、复杂性、非线性、参数不确定性、机械摩擦以及外界随机干扰因素的被控对象,与球杆系统相比,板球系统的控制更
随着计算机软硬件技术的快速发展,大量娱乐性的三维游戏如雨后春笋般的出现,其中,游戏中场景的渲染质量、角色模型的仿真控制、大规模群体的处理等往往是衡量游戏指标的重要