基于HEVC的屏幕内容压缩技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:gmwzg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
屏幕内容指的是电子设备的桌面生成的视频或图像。随着电子设备的迅速普及和发展,屏幕内容在云计算,远程桌面,屏幕传输等众多多媒体领域发挥着越来越重要的作用。与自然图像不同的是,屏幕图像具有较高的图像对比度和复杂的纹理结构,现有的图像或视频压缩技术和标准并不能高效的适用于屏幕图像的压缩。考虑到屏幕内容的重要性,寻求高效的屏幕内容的压缩方案显得日益迫切。新一代的视频压缩标准High Efficiency Video Coding(HEVC)引入了新的编码工具来改进屏幕内容的压缩性能。本文根据HEVC标准的编码框架,针对屏幕内容的特点设计了一系列算法帮助改进屏幕内容的压缩性能,分为以下两个方面:  第一,考虑到屏幕图像的特征和图像与图像之间的相关性,提出了基于哈希特征的屏幕图像集合的编码方案,主要包含哈希特征提取,最优预测结构的构建和参考帧管理三部分。为了有效去除图像间相关冗余,我们提取屏幕图像的哈希特征来衡量图像间的相关性,并且在块级别对图像进行处理。首先我们将屏幕图像划分为若干相同大小的块,提取块的哈希特征并计算哈希值来唯一代表一个图像块。我们将图像与图像之间相同块的数量作为衡量图像之间相关性的关键因素,从而图像集合中所有图像可以抽象成为有向图模型,据此,我们建立图像集合的一种优化的最小生成树预测结构。最后将我们的方案嵌入到HEVC帧间运动补偿机制中,并改进其中的RPS参考帧管理机制。实验结果表明,与HEVC相比,基于哈希特征的屏幕图像集合编码方案显著提高了编码性能。  第二,为了更好的利用帧间的相关性来提高帧间运动补偿机制的效率,我们基于屏幕内容的特点,提出了一种基于哈希字典的屏幕内容编码方案。主要分三个部分:图像哈希特征的提取,哈希字典的构建与更新以及哈希字典模式的嵌入。首先对重建图像进行哈希特征提取,在编码端和解码端维护一种哈希字典,用来保存重建的图像块和哈希值。预测过程中,如果可以在字典中找到与当前块相同或相似的块,我们可以直接用字典中的块作为当前块的参考图像块。为了提高预测的准确性,我们将提出的方案作为一种额外的模式嵌入到HEVC当中,并通过率失真优化模型来确定是否选用新的模式,最后我们将重建图像块写入字典对字典进行更新。实验证明,我们所提出的新模式很大概率上在率失真优化时被选用,最终结果也可以看出,我们的方案的确取得了一定的增益,尤其是当视频图像数量增多时,我们的方案显著提高了HEVC的编码性能。
其他文献
目前,具有视频分析处理能力、可对运动目标实现识别和跟踪的智能化视频监控系统已成为研究的热点和主流。 针对智能视频监控系统中运动目标的识别跟踪问题,本文研究了动背景
学位
随着信息技术的高速发展,人们的安全意识越来越强,同时对安全、方便的身份认证技术提出了更高的要求。目前,传统的安全技术已经不能满足当前的要求,于是人们把目光转向生物识别领
软件文档是软件的重要组成部分,提高软件文档的质量对于软件质量的提高起着很大的作用。随着软件工程标准化的发展,软件文档规范化已经受到了各个行业的高度重视,提出了各种行业
随着INTERNET的发展,互联网络环境下的信息安全由于涉及到国家安全和社会稳定,已日益受到各国政府部门和社会各界的重视。信息安全的关键内容是密码理论,而密码理论的核心则是密
学位
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。人们希望将这些数据转换成有用的信息和知识,以便更好地利用这些数据,给决策制定提供数据支持
论文系统阐述并实现了一套 WEB 文本分类的技术。主要技术包括 WEB 文本收集、WEB 文本预处理、处理后的 WEB 文本的中文分词、预抽取训练样本及使用 SVM 方法进行文本训练和
人脸识别是所有的生物识别方法中应用最广泛的技术之一,同时也是模式识别和计算机视觉领域中一个非常具有挑战性的重要课题。人脸识别的方法有很多,其中神经网络可以通过自训练
计算机网络技术的日益成熟为远程教育的发展带来了新的机遇。Web为非实时的远程教育提供了一个优秀的平台,基于Web的远程教育因为其学习方式灵活、客户端使用简单而得以广泛推
办公自动化是现代化办公的趋势。通过采用现代工具和现代作业方式,它可以极大地提高工作效率。如何充分利用Internet网在高校建立起现代化的办公自动化系统,成为了一个需要深