基于视觉感知的HDR视频编码方法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:xiongying1207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相对于传统的低动态范围视频,高动态范围(High Dynamic Range,HDR)视频能够在高亮和低暗的区域呈现出更加丰富的细节以及对比度信息,给人们带来更加接近真实世界的视觉体验。因此,HDR技术在监控安全、影视娱乐等领域有广泛的应用前景。现有的高性能视频编码(High Efficiency Video Coding,HEVC)标准虽然兼容对HDR视频的编码,但考虑到HDR视频高动态范围和高精度的特殊性以及人眼视觉感知的复杂性,编码后的视频仍存在较多的感知冗余。本学位论文主要从人类视觉感知特性出发,围绕HEVC对HDR视频编码过程中的率失真优化技术、编码前的预处理过程以及不同动态范围视频用户码流的兼容性问题展开研究,实现在保证视觉感知质量的同时去除HDR视频中的感知冗余。(1)针对现有HEVC标准的率失真优化技术缺乏考虑视觉对HDR视频编码失真的感知特性的问题,提出一种基于对比敏感度函数的HDR视频编码率失真优化算法。首先根据对比敏感度函数的定义得出对比敏感度与人眼对误差敏感程度的关系;然后针对10比特HDR视频的亮度分量,以树形编码单元(Coding Tree Unit,CTU)为基本单位,求取影响视觉对比敏感度的适应亮度值以及空间频率;最后进一步修正对比敏感度作为感知因子对HEVC编码过程中每个CTU的拉格朗日因子进行缩放,实现更加符合视觉感知的码率分配,去除感知冗余。实验结果显示在相同HDR-VDP-2和PSNR_DE分值下,和原始编码平台相比码率平均节省5.6%和8.3%,表明提出的方法在保持感知质量情况下能有效降低码率。(2)考虑到现有HDR视频编码预处理过程中量化方法针对动态范围的单一性而产生的失真,提出一种依据HDR视频内容和动态范围自适应的预处理量化方法。首先,对预处理过程中的感知量化(Perceptual Quantizer,PQ)方法对HDR视频对比度造成的失真进行分析;然后依据HDR视频各个通道像素的概率密度分布以及视觉的对比度感知特性优化10bit整型量化信号的分布,尽可能地保护HDR视频的对比度信息;最后,依据优化策略结合逆PQ对原始HDR视频信号采用映射的方法进行优化,从而实现对HDR视频的自适应预处理量化,减少量化产生的失真。实验结果显示在相同HDR-VDP-2和PSNR_DE质量指标下,提出的方法码率平均节省8.7%和15.3%,表明所提出的方法能有效减少量化过程所造成的失真,提升对HDR视频编码压缩的性能。(3)针对标准动态范围和HDR用户视频信号流兼容性问题,本文结合现有的色调映射(Tone Mapping,TM)算法提出了两种动态范围可分级的HDR视频编码方案。方案一中对残差层所包含的HDR失真信息结合视觉的感知特性进行了分析,并采用引导滤波的方法对残差层进行处理以降低编码所产生的码率。方案二中首先对采用的TM算法进行了研究,并提取出针对不同HDR视频帧的色调映射算子(TM Operate,TMO),结合视觉的感知特性对TMO进一步修正后作为辅助信息传输到解码端重建出HDR视频。相对于传输残差层的编码方法,TMO单通道、高频信息较少的特性作为辅助信息能够节省一定的码率同时能够减少压缩算法所产生的失真,验证了可分级编码方法的有效性。
其他文献
高校来华留学生的学习质量是我国国际教育事业中的重要组成部分,关注影响留学生学习倦怠的因素,保障其培养质量,既是国际教育事业的重点,也是目前心理学的研究热点之一。心理资本作为一种稳定的心理状态,是一种具有积极导向的、可再生的非稀缺资源。被视为可开发的、可长期保持人才竞争优势的新型战略资源。心理资本的投资和开发是个人创造竞争优势的基础和动力,探寻心理资本与学习倦怠关系,通过提升个体的心理资本水平,使个
近年来,卷积神经网络在以识别与分类为代表的诸多图像处理任务上大放异彩。但是与其引人注目的性能相对的是,卷积神经网络的理论解释仍然匮乏。当前,诸如广义特征提取子、信
随着经济的不断发展,农产品深加工行业在顺应传统产业转型升级飞速发展的潮流的同时,也面临着巨大的竞争压力,如何在激烈的竞争环境中占据一席之地,寻找到适合自身持续稳定发展下去的竞争战略至关重要。本文以青岛华红食品有限公司为研究对象,通过分析该企业与周边竞争对手企业自身的优势、劣势,以及外部环境的机会和威胁,为目标企业寻找到最优的竞争战略,并针对企发展现状提出相应的对策和建议,以推动企业未来更好的发展。
滇东北小河铅锌矿床位于昭通市巧家县小河镇,是滇东北矿集区内赋存于震旦系灯影组白云岩中铅锌矿床之一。本文以小河铅锌矿床为研究对象,基于前人的研究成果,结合区域地质特征、地质背景与详细的野外地质调查,针对矿区主要矿体,开展了金属硫化物电子探针分析、微量稀土元素地球化学分析、C-O-S同位素地球化学研究,探讨成矿流体和成矿物质来源,分析矿床成因机制。主要取得以下认识:(1)确定了小河铅锌矿含矿岩系岩石类
基于生物信息的身份认证技术是近年来计算机视觉领域较为热门的研究方向。步态识别是一种基于行人行走时的姿态特征的生物信息身份认证手段,可以用于远距离的被动身份识别。
由于新兴技术对电源的特殊要求,传统的供电方式已经无法满足,所以我们必须找到新的电源,消除现阶段电池的局限性。能量俘获技术可以利用振动俘能装置将周围的机械能转换为电能并存储利用。振动型俘能装置成为一种为低能耗的电子元件以及无线传感器提供电能的可能,并且可以克服传统供电方式的诸多问题。且随着轨道交通的快速发展,轨道路线不断地增加,轨道车辆的运行日益增多,所以对轨道车辆在运行过程中由于轨道车辆的速度、质
随金融市场的迅速发展,个人业务在各大商业银行中竞争十分激烈,从各大商业银行未来的发展方向和战略目标来看,个人业务的发展占据重要的地位。中国银行贵阳市观山湖支行于2011年在观山湖地区选址成立,随着该区域商业银行的不断新设增加,观山湖支行将与其所在区域内各家商业银行乃至贵阳市内的商业银行在个人业务方面围绕产品、渠道、客户等多方面展开激烈的竞争。本文主要是分析观山湖支行在现阶段市场环境下,在所面临的内
网络技术和应用的飞速发展先后催生了认知网络和软件定义网络(SDN)等新网络技术概念的诞生,也带来愈加巨大的管理挑战和安全风险。最新研究已将机器学习和深度学习的新方法引
我国西部A油田某区块,储层埋深超过8000m,地层压力接近140MPa,储层最高温度接近190℃,表现出超深、超高压和超高温的“三超”特征。压裂施工中,最高施工压力达136MPa,对安全改造作业带来了极大的挑战。本文针对此类“三超”储层,通过搭建实验平台、优选低摩阻加重压裂液、明确压裂液体系性能影响因素、确定各添加剂使用浓度,形成了交联时间可控、耐温耐剪切性能良好的加重压裂液体系。首先,建立包含流
现场钻芯取样是一种简单、直观、有效的路面性能检测方法,是道路进行养护决策时最为实用的手段之一。但现场钻取的芯样受路面病害、结构形式、钻芯操作等影响,所钻取的芯样高度往往达不到标准试件的高度,采用已有的评价方法,不能准确得到其力学指标。因此研究尺寸效应对芯样力学性能的作用机理十分重要。本文基于室内试验、数值模拟的组合分析,借助实体工程试验进行论证,对沥青混合料的基本力学性能尺寸效应进行了较系统的研究