论文部分内容阅读
屏幕内容指的是电子设备的桌面生成的视频或图像。随着电子设备的迅速普及和发展,屏幕内容在云计算,远程桌面,屏幕传输等众多多媒体领域发挥着越来越重要的作用。与自然图像不同的是,屏幕图像具有较高的图像对比度和复杂的纹理结构,现有的图像或视频压缩技术和标准并不能高效的适用于屏幕图像的压缩。考虑到屏幕内容的重要性,寻求高效的屏幕内容的压缩方案显得日益迫切。新一代的视频压缩标准High Efficiency Video Coding(HEVC)引入了新的编码工具来改进屏幕内容的压缩性能。本文根据HEVC标准的编码框架,针对屏幕内容的特点设计了一系列算法帮助改进屏幕内容的压缩性能,分为以下两个方面: 第一,考虑到屏幕图像的特征和图像与图像之间的相关性,提出了基于哈希特征的屏幕图像集合的编码方案,主要包含哈希特征提取,最优预测结构的构建和参考帧管理三部分。为了有效去除图像间相关冗余,我们提取屏幕图像的哈希特征来衡量图像间的相关性,并且在块级别对图像进行处理。首先我们将屏幕图像划分为若干相同大小的块,提取块的哈希特征并计算哈希值来唯一代表一个图像块。我们将图像与图像之间相同块的数量作为衡量图像之间相关性的关键因素,从而图像集合中所有图像可以抽象成为有向图模型,据此,我们建立图像集合的一种优化的最小生成树预测结构。最后将我们的方案嵌入到HEVC帧间运动补偿机制中,并改进其中的RPS参考帧管理机制。实验结果表明,与HEVC相比,基于哈希特征的屏幕图像集合编码方案显著提高了编码性能。 第二,为了更好的利用帧间的相关性来提高帧间运动补偿机制的效率,我们基于屏幕内容的特点,提出了一种基于哈希字典的屏幕内容编码方案。主要分三个部分:图像哈希特征的提取,哈希字典的构建与更新以及哈希字典模式的嵌入。首先对重建图像进行哈希特征提取,在编码端和解码端维护一种哈希字典,用来保存重建的图像块和哈希值。预测过程中,如果可以在字典中找到与当前块相同或相似的块,我们可以直接用字典中的块作为当前块的参考图像块。为了提高预测的准确性,我们将提出的方案作为一种额外的模式嵌入到HEVC当中,并通过率失真优化模型来确定是否选用新的模式,最后我们将重建图像块写入字典对字典进行更新。实验证明,我们所提出的新模式很大概率上在率失真优化时被选用,最终结果也可以看出,我们的方案的确取得了一定的增益,尤其是当视频图像数量增多时,我们的方案显著提高了HEVC的编码性能。