视频压缩中的高效帧内编码技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fjnu_lhx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术以及移动端设备的不断发展,以图像/视频为主要载体的多媒体应用层出不穷,如数字电视,互联网视频,虚拟现实,视频直播等。这些多媒体应用已经逐渐成为人们生活中不可或缺的部分。海量的视频对于视频数据的存储和传输提出了更大的挑战。为了高效地对视频进行存储和传输,视频编码技术在其中起着重要作用,这也使得对视频编码技术的研究一直是学术界和工业界的热点。为了更加高效地对日益普及的高清和超高清视频进行压缩,新一代国际视频编码标准HEVC(High Efficiency Video Coding)于2013年正式发布,与上一代国际视频编码标准H.264/AVC相比,在相同的主观质量下,能进一步获得50%左右的码率节省,大大提升了视频压缩的性能。2014年,国内AVS工作组发布了我国第二代视频编码标准AVS2,主要是针对超高清视频。AVS2能够获得与HEVC相近的编码性能。然而,由于这些新的编码标准中都采用了更加灵活的编码单元划分结构,更加精细的帧内预测模式等技术使得编码性能得到较大提升的同时也带来了较高的编码复杂度。因此,如何有效地对编码器进行优化从而降低编码复杂度对实际应用显得至关重要。同时,随着高画质视频的逐步普及,未来的视频压缩标准需要处理数据量更加庞大的视频,因此,在现有视频编码标准的基础上继续提高视频压缩效率仍然具有很重要的意义。帧内编码作为视频编码标准中的核心模块之一,如何高效地对其进行优化对整个视频编码具有重要的作用。本文从降低帧内编码的复杂度以及提升帧内编码性能等角度展开深入的研究。具体的研究内容分为以下四个部分:第一,本文提出了快速的帧内模式和编码单元决策方法用于降低帧内编码的复杂度。目前最新的视频编码标准中的帧内编码引入了大量的预测模式(HEVC中引入35个模式,AVS2中引入33个模式),同时编码单元都采用了基于四叉树的划分结构。由于最佳的预测模式和编码单元划分是在编码端通过率失真优化过程得到,这将大大增加帧内编码的复杂度。为了在不影响压缩性能的条件下降低最新标准中帧内编码的复杂度,本文提出了快速帧内模式决策方法和快速编码单元划分决策方法。在快速帧内模式决策方法中,基于平均梯度的方法被提出来用于减少需要进行粗模式选择和率失真优化过程的模式的数量,从而有效地降低帧内模式决策的复杂度。在快速编码单元划分决策方法中,首先,纹理平滑的编码块被提前检测出来,直接选择较大的编码单元进行编码;其次,对于非平滑的编码块,本文利用加权的线性SVM进行编码单元的提前划分决策;最后,对于没有被提前划分的编码单元,另一个加权的线性SVM被用来进行编码单元提前终止的决策。实验结果表明,在全帧内编码配置条件下,本文提出的方法相比于HEVC的参考软件HM-14.0,可以减少50%以上的编码时间,同时对压缩性能的改变可以忽略。第二,本文提出了基于局部和非局部相关性的混合帧内预测方法用于提升帧内预测的性能。现有视频编码标准中的方向预测模式能够对具有方向性纹理的块进行较好的预测,planar模式(或者plane模式)和DC模式用于对平滑块进行预测。然而,对于更加复杂的编码块,现有标准中的帧内预测将不再高效。为了提高现有视频编码标准中的帧内预测的编码效率和为下一代视频编码标准的制定做技术储备,基于对复杂编码块的分析,本文提出了基于局部和非局部相关性的混合帧内预测方法,该方法包括三个部分:1)自适应的模板匹配预测方法,利用非局部相关性用于复杂纹理块的预测;2)联合局部和非局部相关性的预测方法,用于对既有复杂纹理又有较强方向纹理的块进行预测;3)基于邻近模式相结合的预测方法,利用更多的局部相关性用于对模糊的块进行预测。实验结果表明,与HEVC的参考软件HM-14.0相比,在全帧内编码配置下,本文提出的混合帧内预测平均能够获得3%左右的码率降低。第三,本文提出了自适应的色度预测方法用于提升帧内色度预测的性能。目前主流视频编码器的输入视频格式为YCb Cr420。为了去除Y,Cb和Cr这三个信道之间的冗余,线性模型(Linear Model,LM)模式被提出来利用已经编码重建的亮度块Y来预测待编码的色度块Cb和Cr。考虑到LM模式中参数估计存在的一些不足,本文提出了自适应的模板选择方法用于提高LM中参数估计的准确性,从而提升色度Cb和Cr的预测性能。考虑到LM模式没有利用色度分量之间的相关性,本文提出了自适应的Cr预测方法用于进一步提升Cr分量的预测性能。具体来说,在进行Cr预测时,本文不仅利用已重建的Y和Cr之间的相关性,同时也考虑了已重建的Cb和Cr之间的相关性。实验结果表明,本文提出的改进方法相比于LM在性能上有了进一步的提升,同时提出方法对编解码复杂度的影响可以忽略。第四,本文提出了信号依赖的自适应帧内变换用于提升帧内变换的性能。传统视频编码中采用的都是信号不依赖的变换。例如,DCT和DST被用于HEVC帧内预测之后残差的变换,AVS2则主要采用了DCT变换。虽然固定变换DCT/DST在特定条件下已经被证明近似于最优的KLT变换,然而它们是信号不依赖的变换,仍然不能够很有效地适应自然视频图像动态波动的特性。针对当前固定变换的这种局限性,本文提出了基于奇异值分解(SVD)的信号依赖的帧内变换方法。提出的方法利用基于预测块生成的合成块与残差块之间的结构相似性,对合成块进行SVD得到一对变换矩阵,然后将该变换矩阵用于对应的残差块的变换中。因此,提出的变换对残差块具有一定的自适应性。此外,本文进一步将提出的自适应变换扩展到基于模板匹配的预测残差中,用于提升模板匹配中残差变换的性能。实验结果表明,本文提出的方法能够提升现有视频编码标准中帧内变换性能,从而提升了帧内编码的性能。
其他文献
文本情感分析技术可以挖掘互联网文本中蕴含的情感信息,使我们高效的了解人们针对某实体的观点,并根据这些观点做出决策。然而当今互联网应用中的文本特点却对传统情感分析技
目的:探讨老年脑梗死并发肺部感染有效的护理方法。方法:采取加强病室空气的管理、强化基础护理、合理使用抗菌药物、开展心理护理等措施。结果:减少并发症的发生,促进肺部感染
宫颈癌是女性最常见的生殖系统恶性肿瘤,其发病率和病死率在女性恶性肿瘤中居第二位,仅次于乳腺癌。据2013年统计,全球宫颈癌标准化年龄的发病率和病死率逐年提高,成为全球范围内
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着科学技术的发展,模式识别在越来越多的社会活动中扮演重要角色,常见的有文本数据识别、人脸图像识别、遥感图像识别、生物信息识别等。与此同时,高维数据的出现也给模式
以蝴蝶兰花梗为试验材料,研究不同浓度的6-BA和NAA组合对腋芽诱导的影响,并应用正交试验设计,研究了基本培养基、6-BA、NAA和椰乳浓度对萌发腋芽增殖的影响,并进行了生根培养
建筑行业在近几年得到了快速的发展,建筑的消防设计成为了人们关注的重点问题之一。在高层建筑中,消防防火排烟设计显得更加重要,影响着建筑抵抗火灾的能力,而且对人们生命安全有
目的探讨完带汤配合克霉唑栓外用治疗复发性念珠菌性阴道炎的临床效果。方法将86例复发性念珠菌性阴道炎患者随机分为两组各43例,对照组单用克霉唑栓外用治疗,研究组使用完带
信托是一项移植自英美法系的财产制度,自《信托法》颁布以来,提到信托登记便存在“有法可依,无法操作”的声音。我国《信托法》第十条原则性地规定了以特定的财产设立信托应