论文部分内容阅读
高效视频编码(High Efficiency Video Coding,HEVC)是H.264/AVC的继承与发展,在保持视频质量良好的情况下进一步提高视频编码效率。其帧内预测相较于原本的H.264,角度方向的种类增加且采用的编码结构更加灵活,编码的性能也有所提高,但是编码的计算复杂度大大增加。而人们在观看测试序列时会关注一些显著性高的区域,对于一些边角以及背景信息会自主忽略。为了解决HEVC编码器中计算复杂度庞大的问题,本文研究的主要内容是通过建立显著度检测模型来模拟人类视觉系统,提取测试序列中的视觉显著性信息,并在帧内预测编码中加入该信息。主要工作包括以下几个方面:(1)提出了一种结合全局特征和局部特征显著度检测模型。首先,利用图像签名(Image Signature,IS)方法得到空域全局显著度图;然后,利用基于离散余弦变换(Discrete Cosine Transform,DCT)低频交直流系数的空域局部显著性检测方法建立的亮度特征显著图和纹理特征显著图,并将两种特征显著图融合,得到空域局部显著图;最后,线性融合空域全局显著图与空域局部显著图得到最终显著度图。(2)提出了一种基于显著度的帧内预测优化算法。在编码单元(Coding Unit,CU)深度划分方面,本文利用所提出的显著度检测模型得到当前帧中所有最大编码单元(Largest Coding Unit,LCU)块的显著度值,再根据显著度值与显著度区域的对应关系得到当前LCU块所属的深度范围;在帧内预测模式选择方面,首先基于Sobel算子进行边缘检测得到当前预测单元(Prediction Uint,PU)的主方向模式,然后通过显著度检测模型计算当前深度下PU的显著度值,并为当前PU选择显著度区域,根据显著度区域与候选模式子集的关系,找到合适的候选模式子集,再将主方向与此模式子集合进行进一步的筛选,最后进入最终的率失真优化(Rate Distortion Optimization,RDO)模式选择。(3)实验中本文引入基于眼部轨迹加权结构相似性(Eye-tracking Weight Structural Similarity Index,EWSSIM)作为主观质量评价标准,并对本文算法进行检测分析。实验结果表明:本文提出的显著度提取模型可以准确检测视频中显著度高的区域,基于显著度的帧内编码优化方案在保持客观视频质量和主观视频质量同时,有效降低编码时间。