论文部分内容阅读
随着数字图像技术的快速发展和人们对视觉体验效果要求的不断提升,视频编码算法的研究已占据了重要地位。传统基于块的混合编码方案对视频编码性能提升都是以极高编码复杂度为代价的,近年来,生物医学的飞速发展给基于人眼视觉感知(HVS)的编解码技术带来了可能。基于HVS的编解码技术将人眼视觉感知特性与视频编解码技术相结合,目的是更大限度的去除视频信息中的视觉冗余。该技术将成为未来视频编解码技术研究领域的趋势和热点。本文对主流编码器使用的关键视觉感知技术进行了学习与研究,主要工作和贡献如下:(1)对应用广泛的HVS特性及基于HVS特性的编码方法进行了概述。具体而言,对学者们提出的基于HVS特性的编解码算法模型、质量评价模型等进行了介绍;对视觉感知率失真优化技术进行了理论分析,该技术把作为视频编码理论基础的率失真优化技术与HVS编码方法相结合,可以充分利用视频视觉冗余信息,实现码率与失真更合理分配。(2)对感知率失真优化技术在H.264、HEVC等主流编码器中的应用进行了研究。首先对X264编码器中感知率失真优化技术在编码各模块的应用进行了简要分析;并对感知率失真优化的码率控制算法进行了理论分析;对学术界及产业界缺少理论分析文档的两个关键视觉感知技术,空域VAQ与时域MBTree算法,进行了理论分析和性能评测;并针对MBTree算法映射模型基于经验性的,且与众多编码参数存在复杂相关性的特点,提出编码复杂度不变的分辨率自适应量化参数调优模型。实验证明该模型可以有效提升视频编码质量。(3)提出了基于竞争决策与率失真优化的量化参数寻优算法。本文对传统竞争决策算法进行了迭代改进,并应用于获得MBTree算法性能最优模型。该算法既完全继承了原MBTree算法基于感知技术的思想优势,又有效解决了原算法的模型缺陷,尝试探索MBTree算法思想可以取得的性能提升上限。实验证明,改进算法离线获得的最优模型相比原模型可以显著提升视频编码主观SSIM、客观PSNR与帧级失真MSE波动等性能。