基于对象的视频编码技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:oo789458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几十年来信息技术的发展,社会的信息化程度在不断地提高,人们对视频信息的需求也越来越迫切。数字视频的应用领域和使用范围越来越广泛,视频编码技术受到了前所未有的重视。MPEG-1/2标准的制定使数字视频走进了千家万户,但是随着计算机技术、网络技术、数字技术、无线技术和视频编码技术的不断发展,人们已经不再满足于被动地接受多媒体信息,而期望更多的交互性。针对视频编码技术的发展,MPEG组织制定了MPEG-4国际标准,提供对任意形状视频对象的编码功能。MPEG-4基于对象的视频编码是实现基于内容交互功能的关键。为了实现MPEG-4基于对象的视频编码的实际应用,编码效率和实时编码技术是很关键的研究领域。 在表达视频对象时,处在对象外的透明部分是没有定义的,当进行视频对象编码时必须对其进行填充,以提高压缩编码的效率。在第二章中,首先简要介绍了MPEG-4基于对象的视频编码的基本概念,然后在讨论了现有的基于宏块的重复填充算法和线性外插填充算法的基础上,提出了一种扩展平均填充算法,用于填充重建的视频对象平面(VideoObjectPlane,VOP)以外的透明部分。与现有的填充算法相比,扩展平均填充算法更加充分地利用了VOP边界象素信息,提高了填充值的精度;该算法并不区分水平或者垂直方向的填充,更符合对象运动方向的随机性;该算法用VOP内象素的均值来填充远离VOP边界的透明区域,使不透明区域到透明区域的过渡更加平滑。仿真结果表明,扩展平均填充算法在编码效率(峰值信噪比和编码比特的压缩率)方面优于现有的填充算法:与基于宏块的重复填充算法和线性外插填充算法相比,该算法的PSNR分别提高了0.1~0.2db和0.15~0.35db,编码比特压缩率分别提高了2~5﹪和2~6﹪。 形状编码是MPEG-4基于对象的视频编码的关键。在MPEG-4中,形状编码的核心算法是基于上下文的算术编码(CAE)。当进行帧间形状编码时,为了提高CAE的编码效率,必须对编码的形状信息进行形状运动估计。为了实现实时的形状编码,必须对形状运动估计算法进行优化。第三章首先简要介绍了MPEG-4中形状编码的基本概念,然后在讨论了MPEG-4验证模型中形状运动估计算法、基于内在特性的形状快速运动估计算法、基于边界象素的形状快速运动估计算法的基础上,本文提出了一种基于对象边缘的形状快速运动估计算法。与现有的三种形状运动估计算法相比,基于对象边缘的形状快速运动估计算法更加充分地利用了邻近形状块之间形状运动向量的相关性,提高了形状运动向量预测值的精度;该算法还充分利用了形状运动估计时的边界特性——这也是该算法的核心思想,把搜索区域设定在VOP的边界附近,大大提高了形状运动估计的速度,而边界形状块的匹配精度并不会有明显的下降。仿真结果表明,基于对象边缘的形状快速运动估计算法的形状运动估计速度大大超过现有算法的形状运动估计速度,其平均搜索点数只有MPEG-4验证模型中算法搜索点数的0.82﹪,而形状的编码效率并没有降低。 为了实现视频对象的实时纹理编码,必须对纹理运动估计算法进行优化。第四章首先简要介绍了MPEG-4中视频对象边界纹理的多边形匹配方法,然后在讨论了新三步搜索算法、四步搜索算法、基于块的梯度降低搜索算法、钻石搜索算法的基础上,本文提出了一种基于对象的纹理快速运动估计算法。与现有的四种纹理快速运动估计算法相比,基于对象的纹理快速运动估计算法充分利用了视频对象的形状信息与对象边缘宏块的匹配特性——这也是该算法的核心思想,从而大大提高了边界纹理宏块的运动估计速度;该算法还充分利用了对象内部宏块运动的相关性,不仅避免了运动估计时匹配误差陷入局部最小点,而且提高了运动估计的速度;另外,该算法还充分利用了纹理宏块的编码特性,通过两个中断运动估计过程的判决方法来进一步提高运动估计的速度。仿真结果表明,基于对象的纹理快速运动估计算法的运动估计速度比其它算法的运动估计速度快,其平均的搜索点数只有全局搜索算法(FS)搜索点数的0.57﹪,而匹配误差保持相近。另外,该算法与其它纹理快速运动估计算法在技术上是互补的,因此最佳的运行方式是联合其它的纹理快速运动估计算法,以进一步提高运动估计的速度——能够和其它快速运动估计算法联合运行是该算法的一个优点。 为了能在PC上实时运行MPEG-4的CoreProfile@Level2视频编解码器,必须对其进行优化。第五章首先介绍了MPEG-4基于对象的形状编码、运动估计与补偿、纹理编码以及相应的解码方法,然后对基于PC的软件视频编解码器进行了全面的优化,本文提出了对MPEG-4基于对象的视频编解码器的优化算法,大大提高了编解码的速度,并降低了内存需求。仿真结果表明,经过优化的视频编解码器的编解码速度大大提高,可以实现CIF(352×288)格式的序列每秒25~30帧的快速编码以及每秒30帧以上的实时解码,这充分说明本文的优化方案是可行的。本文的优化方案对实现各种应用条件下的MPEG-4编解码器具有重要的参考价值。
其他文献
分类号:K871.2单位代码:10422密级:公开学号:201811776硕士学位论文ThesisforMasterDegree论文题目:陶寺墓地研究StudyonTaosiCemetery作者姓名申慢慢培养单位历史文化学院__专业名称考古学指导教师王芬1教授合作导师2021年05月2
学位
研究目的:对石家庄市小学校园足球的开展现状及可持续发展进行调查,从根部发现石家庄市小学校园足球开展现状及可持续发展存在的问题,然后针对问题提出解决方案;推动石家庄市小学校园足球更好发展。研究方法:文献资料法、问卷调查法、逻辑分析法、数理统计法
研究生:王一嵐专业名称:体育人文社会学研究方向:全民健身政策申请学位:教育学硕士指导教师:王旭光教授分类号:学号:201810101001硕士研究生(毕业)学位论文论文题目:健康中国背景下适老化社区老
学位
室外热管理是指通过调控物体与室外环境的热交换进而对物体温度进行管理,包括保温和散热。近年来,随着全球气候变化的加剧和制热/制冷能耗的不断增加,室外热管理因其无能耗、局域温度调节能力强等优势成为研究热点。被动式的室外热管理主要利用可再生能源如太阳、外太空等进行局域的温度调控(制热与制冷),采用的结构包括涂料、金属、聚合物与微纳光学结构等。在这些结构中,微纳光学结构可以
微电子技术、计算技术和无线通信等技术的进步,推动了低功耗多功能传感器的快速发展,使其在微小体积内能够集成信息采集、数据处理和无线通信等多种功能。无线传感器网络(wireless sensor network,WSN)就是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统,其目的是协作地感知、采集和处理网络覆盖区域中感知对象的信息,并发送给观察者。目前,
在大力提倡素质教育的今天,如何能够提高学生的培养质量,培养出符合社会需求的实践型人才是摆在高校面前的一项重要而又亟待解决的任务。高校旅游管理专业实验室作为旅游院校实践性教学环节的重要组成部分,其建设与管理的优劣对于培养学生的创新精神和实践能力具有十分重要的意义。
一、问题的提出我国城市人口年龄结构日渐老龄化,日益庞大的老年群体难于从传统家庭中获得养老资源,养老方式正面临着历史性的变化。社区养老服务的出现,为解决日益严峻的老龄问题提供了新思路。在我国目前家庭与社会都无法完全承担养老服务功能的状况下,
.学校代码:10052tJ^学号:18300104密级:MINZUUNIVERSITYOFCHINA硕士学位论文个性化推荐算法的法律规刹崎究姓名:南楠指导教师:朱芸阳副教授学院:法学院专业:民商法学完成日期:2021.6.10学位论文原创性声明本人郑重声明:所呈交?
学位
混沌是非线性动力学系统所特有的一种运动形式,是确定性的、类似随机的过程。混沌信号具有遍历性、非周期、连续宽带频谱、似噪声的特性。随着混沌同步的方法不断涌现,混沌系统同步及其在保密通信中的应用问题引起了人们的广泛关注,从实际应用出发,如何找出同步技术的最佳方案,越来越成为当今的研究热点和难点问题。本文在深入分析了多种混沌同步方案的基础上,从三个方面研究了提高混沌同步通信系统保密性的方法:选用更为复杂
学位
随着3G标准的制定,下一代移动通信系统(4G)的研究也日益受到人们的关注。OFDM(正交频分复用)技术将高速串行数据流分割为低速的并行子数据流,各自调制到互相正交的子载波上,以其高效的频谱利用率和抗多径干扰的能力,业已成为4G中采用的关键调制技术。但是OFDM系统由于子载波之间必须保持严格的正交性,所以对定时偏差和载波偏差非常敏感。本课题的任务主要是研究OFDM系统的定时和载波同步技术。本文首先简