论文部分内容阅读
近年来,随着多媒体技术的飞速发展,虚拟现实(Virtual Reality,VR)因其沉浸式的体验广受大众喜爱,应用也愈加广泛。主流VR中的视频信息即为球形视频信息。球形视频因用户体验的需要对清晰度要求较高,若未经压缩,数据量巨大,对普通的硬盘存储和网络传输带来很大的挑战。因此,提高球形视频的编码效率非常重要。由于现有视频编码标准的限制,球形视频需要被投影至二维平面形成全景视频再进行编解码操作。在接收端,二维全景视频再被转换为球形视频以供用户观看。正因如此,将球形视频失真作为全景视频编码的失真度量更为合理。现阶段常用的球形视频失真评价指标有球面峰值信噪比、球面均匀权重峰值信噪比、基于卡斯特抛物线投影的峰值信噪比等。基于此,本文以上述球形视频失真为视频质量的衡量标准,对全景视频编码技术进行优化。等距柱状投影ERP、立方体投影CMP、八面体投影OHP以及分段球面投影SSP是全景视频较为典型的投影格式。各投影格式由于投影算法不同,具有不同的特征。但四种投影格式均存在插值操作,改变了球面像素本身等权重的特性。因为全景视频采用现有编码器编码,所以在模式选择过程中仍采用率失真优化方法。本文对上述不同投影格式设计引入与之相对应的权重,改变在率失真代价计算过程中,插值情况不同区域的失真所占比重,提出基于球面失真测度的率失真优化技术。从而在二维平面实现球面像素等权重的特性,提高全景视频的编码效率。本文所提出的率失真模型可平均节省1.47%的编码码率。鉴于ERP格式是目前接受度最高的全景视频投影格式,本文在帧间编码的预测过程针对ERP格式进行相关优化。由于全景视频对分辨率要求较高,本文首先在高效视频编码(High Efficiency Video Coding,HEVC)中引入局部自适应运动矢量分辨率(Locally Adaptive Motion Vector Resolution,LAMVR)技术,以提升高清全景视频的编码效率。其次,本文在对当前编码块的纹理复杂度进行预判后,选择适当的门限,对ERP格式的高纬度区域在使用LAMVR技术时进行针对性优化。然后,对ERP格式的高纬度区域内容同样进行纹理复杂度判断,并根据当前编码块的插值情况,对亚像素精度的运动估计进行优化,以期在保持视频质量的同时降低编码的时间复杂度。最后,针对ERP格式对运动估计的搜索算法进行改善。本文所提出的方案在与加入LAMVR技术的方案性能基本保持一致的同时,平均可降低5.57%的编码时间。对有全局运动或存在大量运动的序列编码时间节省尤为明显,最多可降低10.53%的编码时间。