低码率视频编码技术的研究与运动估计的优化

来源 :东北大学 | 被引量 : 0次 | 上传用户:iuxiaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前Internet的带宽仍然是一个瓶颈,特别是接入网方面,还存在着很多难点。从世界范围看,成熟的、廉价的公共交换电话网(PSTN)仍是主要的通信网,还将长期存在。而随着多媒体技术的不断发展,数字视频业务如可视电话、视频会议、安全监视、视频点播等已经深入到人们日常生活、工作中,而且目前无线移动网络的多媒体业务的需求正在与日俱增(3G)。所以为了在低速率通信网中传输视频图像,获得良好的实时传输效果,除了改善网络传输控制机制之外,还需要实现高压缩比、低耗时、能达到实时压缩效果的视频图像压缩方法。 H.263是国际电信协会-电信标准化部门ITU-T(TheInternationalTelecommunicationsUnion-TelecommunicationStandardizationSector)于1996年通过的用于低比特率实时传输的视频编码标准,其设计初衷是满足带宽低于64kbps的低带宽视频应用需求,如视频会议、可视电话等。现在H.263也被应用于视频图像远程实时传输系统中,但原始的H.263在实时性和压缩比等方面还有不少可优化余地。 本文首先研究了视频图像的压缩原理与主要技术;随后系统地论述了H.263标准,对其具体的压缩算法进行了深入细致的研究,并在此基础上设计和实现了编码器,但编码速率难以满足实时通信的要求,所以还需进一步优化提高效率。 由于在H.263编码器中,运动估计与补偿的运算量最大,占编码器总运算量的60%~70%左右,因此为了提高编码器的性能,针对运动估计的经典快速搜索算法进行了深入研究,在研究中发现,这些算法都以原点作为初始搜索中心,均未利用运动矢量的时间和空间相关性,没有考虑视频图像的内在运动特征,而盲目地搜索。由于搜索起点的好坏直接影响运动估计的效率,鉴于此,提出了基于图像运动特征的快速搜索法。该方法在搜索前可判断出视频图像的内在运动趋势,及早发现静态块(即该块的运动矢量为零),从而省去不必要的搜索时间;并且利用已知的运动矢量准确地预测出搜索起点,使其更接近全局最优点,实现了减少搜索点数的目的,削减了运算量,提高了编码效率,基本可以满足实时通信的要求,达到了优化的目的。
其他文献
明天的计算将进入普及计算时代。各种消费电子产品,包括智能手机,PDA,Web-TV,将来的信息家电等等将实现随时随地的计算。这是一个异常广阔和丰富多彩的领域,其设备极度多样化而且
20 世纪90 年代以来,得力于光通信技术的突破性进展和VoIP 技术的逐步完善,电信网和计算机网趋于统一,认同未来通信网的演进方向应是以IP 为核心的分组网络。人们综合市场需
集群系统以其结构可扩展性好,具有高效的计算性能等特性已成为并行处理发展的主流。实现系统内消息的快速传递,提高进程间通信的性能是集群式高性能计算领域的一个重要研究方向
随着空间应用越来越复杂,在轨处理的数据量越来越大,甚至呈现指数级增长的趋势,当单个处理单元的计算平台已经远远不能满足大规模星载应用的计算需求时,星载多处理机平台可望
高分子模拟计算网格(MSCGrid)是上海高校“E-研究院”——上海高校网格的一个重要组成部分,它是基于OGSI规范和网格核心中间件的网格计算环境,主要为化学与材料等基础学科的研
基于内容的图像检索在多媒体数据库应用中是一个很重要的研究领域,而纹理作为图像的一个重要信息,对图像检索具有重要的意义。脉冲耦合神经网络(PCNN)是新一代的人工神经网络,在
随着网络的不断发展,Web网已成为一个巨大的分布式信息空间,为读者提供了一个极具价值的记录。然而,在网上查找信息的读者往往会迷失在Web浩瀚的信息汪洋大海中。这是因为读
本文主要内容如下:第一章着重介绍用到的两项关键技术:工作流和Agent。从它们的概念、功能、优缺点以及相互融合方面作了介绍。第二章在介绍了当前服务复合方法后给出一个基于A
图像处理技术是随着计算机、电子、通信等技术的发展,多媒体、网络技术的广泛应用,以及数学理论的不断完善而逐渐发展起来的一个新的应用领域。在图像处理技术中,图像压缩性
面向服务的架构如Web服务技术,以及Agent技术已经被广泛地应用于各个IT领域。基于Web服务和Agent而提出的服务Agent技术,是对二者的有效结合。它既满足了Web服务的可重复性,低耦