多层次感知视频编码算法优化研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:sansyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频数据的爆发式增长给视频信号的存储和传输带来了巨大挑战。新一代高效视频编码(High Efficiency Video Coding,HEVC)标准应运而生,HEVC采用多项高效编码技术,提供了卓越的压缩性能,在保持相同视频编码质量的情况下,压缩效率相比前一代视频编码标准H.264/AVC提升一倍。基于信号处理的视频编码技术正逐渐接近压缩上限,编码性能的提高是以算法复杂度的指数级增加为代价来实现的。鉴于视频信号的最终接收者是人眼,学者们从人眼视觉系统(Human Visual System,HVS)感知特性出发,进一步消除视频的感知冗余来提升压缩效率。HVS作为视频信号的最终接收器,并不能察觉到特定视觉门限阈值下的信号失真,该阈值就是所谓的恰可察觉失真(Just Noticeable Difference,JND)。JND阈值可通过视觉感知模型进行预测,且可应用于视频编码,以提高视频感知编码效率。量化是视频编码器中的关键模块之一,一个合适的量化参数(Quantization Parameter,QP)可以在保持视觉质量不下降的同时减少编码码率。HEVC中采用基于方差的自适应量化(Adaptive Quantization,AQ)算法,根据方差的大小来调整量化参数偏移量,该算法仅使用样本方差作为视觉感知模型的预测器,存在低估纹理区域和高估边缘区域的失真可见性的问题,因此当前视频编码器中AQ算法的性能可以通过部署更好的视觉感知模型来提高。同时,视频压缩是一个多模块多层级协同的编码过程,包括码率控制、模式选择、运动估计、变换、量化等。由于视频压缩是一个串行编码过程,导致多模块感知优化存在率失真性能耦合效应,单模块算法优化对整体编码性能的影响并不满足线性关系。目前学术界缺乏对模块间相关性的定量分析以及多模块联合优化的系统研究,基于模块间相关性的多层次感知编码联合优化仍然是一大难题。针对视频编码研究现状,本文从自适应感知量化和多模块协同优化两个方面入手,探索基于视觉感知的多模块协同编码方法。本文的研究内容和创新性主要包括:1.本文考虑亮度自适应掩蔽效应和图案掩蔽效应,将JND预测引入至自适应感知量化中以提高AQ算法的率失真性能。具体而言,本文通过JND阈值预测模型估计编码单元(Coding Unit,CU)级JND均值,并将其映射至方差取值空间以保证算法兼容性,推导得到CU级感知量化参数偏移量以实现CU级感知自适应量化。实验结果表明本文提出的自适应感知量化的BD-BR平均降低1.04%,且在相同码率条件下VMAF分数增加0.2101,有效地提高了编码的主观质量。2.本文构建了一个多层次感知视频编码优化框架,并在此框架上进行系统化的算法优化。具体而言,本文定量分析了各编码模块间相关性,并确定各模块优化时的优先级,提出初始参数选择算法,通过从离散的候选参数解空间中依次选择算法关键参数,将复杂的多模块优化简化为连续的单模块优化。结合模块间相关性以及表征图像内容的特征参数,构建在线自适应参数模型,从而实现多模块协同感知编码优化。实验结果表明,该多模块优化方法能够在保持相同码率的条件下,VMAF分数提高0.6936。结合本文提出的感知AQ优化和多模块优化方法,在保持相同码率的前提下,VMAF分数提高0.7609。
其他文献
近年来,高光谱图像分类逐渐成为了高光谱领域中的研究热点,在国民经济发展和国家安全中都发挥着重要作用。高光谱图像具有维度高、冗余性高、数据量大等特点,对高光谱图像特征提取以提高分类准确度是高光谱图像分类任务中的关键问题,特征质量的好坏直接影响着分类准确度的高低。但是,高光谱图像的同物异谱和同谱异物现象、带标签样本数量少、样本标记成本高,以及巨大的数据量使得高光谱图像的特征提取和分类面临着许多困难和挑
二硫化钼(MoS2)是二维材料家族的典型代表,由于其内部结构与石墨烯相似,不仅保留了石墨烯优良的电、光、机械性能。同时其具有1.2~1.8 e V的可调带隙,并且通过改变厚度可以调控禁带宽度,因此在制备电子学器件(如场效应管、发光二极管、光电探测器)上具有独特的优势。随着科技的高速发展,要在芯片上集成大量元器件,传统硅材料会产生漏电和散热不佳等问题,而二维结构的二硫化钼单层薄膜厚度往往是小于1 n
随着现代信息科学技术的不断发展和计算机硬件水平的不断提高,人工神经网络在多个领域得到越来越广泛的应用。人工神经网络由许多非线性计算单元组成,可以通过训练获得处理复杂信息的能力。基于梯度下降算法进行训练的人工神经网络在实际应用中十分广泛,其原理是基于整数阶微积分理论对损失函数进行优化,从而改进神经网络的权值和阈值,使得神经网络在训练过程中不断调整,最终达到训练的平衡点。本文将基于分数阶微积分理论的梯
在实际工程应用中,考虑到产品使用便捷与外形美观等原因,工业产品会尽量减少非必要零部件。相对而言,在信息监测与反馈环节会较为薄弱,只会留下部分必要传感器。因此,对于这类工业产品,仅依靠自身携带的传感器很难得到精确且充足的采样数据,往往只能得到稀疏甚至非均匀的采样数据。若想要对设备进一步开发,首要问题是需要一个较为准确的数学模型,为研究提供基础。考虑到这一较为广泛的工程现象,对于此类仅能得到非均匀稀疏
调节阀作为工业控制中的执行器,是过程控制的关键环节,并且其调控性能高度依赖阀门定位器的硬件特性和控制算法。近年来,压电式智能定位器因其低碳和智能特性逐渐取代喷嘴挡板式定位器,成为一种更加有应用前景的阀门定位器。但国内在该技术领域起步较晚,和进口产品相比仍存在较大差距,尤其是在系统性能分析及控制算法方面仍有改进余地。本文在参考国内外相关文献资料和团队前期工作基础之上,开展如下研究工作:(1)对气动执
近年来,新发展理念推动工业生产制造向高质量发展行进,中国的制造业从粗犷式的增长形式逐步开始转型。永磁伺服系统凭借精度好,运行可靠,结构简单等优点,成为工业控制中的中流砥柱。针对水晶制造业,在切割打磨水晶时需要响应快速且稳定的永磁伺服系统,电流控制作为系统最内环的控制,其电流采样精度及响应时间与整个永磁伺服系统的性能直接挂钩。本文先简要介绍了永磁同步电机的基本结构,并依据坐标变换原理在不同坐标系下建
随着无线通信技术的不断进步,每一代无线通信系统都发生着跨越式的发展。在5G通信系统中,提出了一系列的技术以提升无线网络容量以及通信服务质量。为了提升单位面积频谱效率,下一代无线通信系统将在部分热点区域采用密集部署接入点(AP:Access Point)的方式来形成超密集无线网络(UDN:Ultra-Dense Networks)。通过密集部署的AP,实现了AP围绕用户、以用户为中心。一方面减小了用
近年来,为切实治理水环境安全问题和促进水环境质量的不断改善,全国各流域生态环境监测站点扎实开展水质加密监测,从而保障环保部门及时掌握水质动态情况以及进行水质预警决策分析,因此如何准确地对流域水质数据进行监测和预警已成为当下研究热点之一。然而由于大多数水质传感器通常会受日常维护、录入数据库错误和传感器测量误差等因素影响,因此采集的水质数据会出现两种类型的数据错误:噪声数据和缺失数据,而现有的数据清洗
近年来,以冷、热、电多能流型区域综合能源系统为代表的多能联供技术高速发展,对多种能源的优化调度成为研究热点。本论文利用(火用)效率作为评估指标,基于(火用)流建立冷、热、电多能流系统模型,求解系统最节能-经济的优化调度策略。具体研究内容如下:(1)建立了包含冷、热、电的园区级多能流系统模型。本系统的能源输入包括天然气供热发电和分布式可再生能源风力发电系统,负载为冷、热、电负载。在多能流系统中引入先
情感识别在人机交互等领域应用前景广阔,使机器有效的理解情感可以极大改善人机交互的体验。情感可以通过多种方式表达,而语音是传达情感最为便捷的途径之一。因此如何从语音信号中正确识别说话人情感,在情感识别领域受到了研究者广泛关注。基于此本文开展语音情感识别技术及其应用研究。本文基于深度学习模型,提出了两种语音情感识别方法,分别是基于注意力机制的非线性特征融合方法和基于多通道二维卷积循环神经网络的方法。基