应用多恰可感知失真等级的视频感知编码

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:cx2cx2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了对视频编码中的视觉感知冗余进行充分挖掘,提升视频的主观质量,根据人眼感知特性对视频内容进行分类,建立了一种更符合人眼感知的多恰可感知失真等级视频感知失真测度模型,并将其应用于高效视频编码(HEVC).通过改善传统编码器的比特分配方式,对帧内编码帧与帧间编码帧分别进行处理,根据重分配的比特更新量化参数(QP),实现了视频感知编码.实验结果显示:与HEVC标准测试模型(HM)中的方法相比,提出的算法能够在近似同等的码率下获得更好的视频主观质量.
其他文献
基于程潮铁矿尾砂胶结充填背景,配制7组不同Talbol指数n的连续级配胶结充填体试样,开展了单轴压缩胶结充填体声发射(AE)监测试验,获取了胶结充填体强度及声发射特征参数.研究结果表明:连续级配胶结充填体的强度随n的增大呈震荡上升,达到最大值后骤然下降,当n=0.5时,连续级配胶结充填体强度最优,连续级配胶结充填体试样破坏后表壁以主裂纹为主,主裂纹发育完整,属于单一裂纹贯穿破坏,当n≠0.5时,主裂纹沿扩展方向发生偏转,属于裂纹绕行扩展破坏;当n=0.5时,声发射能率与累积能量均呈现出明显与全应力应变曲线
为实现离焦状态下相机的精确标定,提出了一种基于圆形二值相移图案的标定方法.首先,使用相移法生成圆形相移图案,并对图案进行二值化以避免液晶显示屏幕伽马非线性误差影响,提高相位精度;然后,利用图案携带的相位信息直接定位椭圆环带区域作为目标区域,并对目标进行对偶椭圆拟合,获得特征点的亚像素精度坐标;最后,建立与世界坐标的联系,完成标定过程.模拟和实验结果表明:对于不同的相机离焦程度,提出的方法均能够实现
为研究强冰载荷作用下海洋结构物发生的非线性变形响应,基于状态型近场动力学方法和非线性结构动力学理论,建立了一种冰与悬臂梁结构物非线性动力耦合预报方法.首先,建立了冰与悬臂梁结构物非线性动力耦合数值预报模型;然后,分别以悬臂梁受迫振动和海冰冲击算例来验证耦合模型采用的结构动力模块和海冰破坏模块计算的准确性;最后,开展冰柱高速冲击悬臂梁算例分析验证建立的冰与悬臂梁结构物非线性动力耦合预报方法的有效性.计算结果表明:冰柱高速冲击悬臂梁过程中上端部出现层裂破坏,悬臂梁变形使柱体下端部发生非对称破坏,下端表面出现斜
针对导向矢量时变导致频率分集阵列-多输入多输出(MIMO)雷达参数估计误差增大的问题,提出一种基于块稀疏的距离和角度参数联合估计方法.首先,就导向矢量时变性对参数估计性能的影响进行了理论分析;然后,通过公式推导证明了块稀疏理论在频率分集阵MIMO雷达参数联合估计中的适用性,并提出了基于块稀疏的参数联合估计方法,给出了参数估计的具体流程;最后,通过仿真对参数估计性能进行了分析.理论分析及仿真结果表明:基于块稀疏的参数联合估计方法可实现单次快拍下多目标距离和角度参数的联合估计,估计能力优于传统谱估计方法;在单
基于卷积神经网络提出了一种多任务模型将乳腺癌组织学图像分为良性与恶性及其子类.该模型是多任务模型,任务一将病理图像分为良性与恶性,任务二将图像分为良性与恶性的子类.模型总的损失函数是两个分类任务损失函数的加权和.该模型采用卷积层和全局平均池化层替代末端全连接层作为分类层,应用数据增强方法提升模型的性能.模型使用乳腺癌病理图像数据集BreaKHis进行消融实验并与VGG16模型进行对比.实验结果显示
针对现有盲图像质量评价只关注图像局部或全局特征,且难以有效聚合特征等问题,提出了一种基于多层级信息稀疏表征的评价方法.首先,利用合成失真技术构建大规模数据集;然后,在原始图像上提取图像块作为初级视觉信息建立局部描述子集,同时通过卷积神经网络提取高级语义信息建立全局描述子集,在此基础上利用稀疏编码进行无监督学习训练,得到局部描述子码本和全局描述子码本;最后,汇聚目标数据集训练样本在两类码本上的稀疏编
针对时变未知环境干扰及模型不确定下的全驱动型无人水下航行器(UUV)的悬停控制问题,提出了一种基于线性扩张状态观测器(LESO)的鲁棒动态面控制算法.首先,根据系统模型设计LESO在线估计时变环境力与模型不确定性引起的复杂干扰;然后,基于标称模型和LESO估计的UUV状态,采用反步法设计控制器,并引入动态面控制技术得到平滑的虚拟控制律导数,同时在控制律中引入自适应鲁棒项来补偿级联控制系统的不确定性;最后,证明了UUV闭环级联控制系统的所有误差信号一致最终有界.通过对一艘全驱动型UUV的仿真实验,验证了该方
为研究绿锈(GR)对四环素(TC)的吸附性能,考察了投加量、pH值和天然有机物对GR吸附TC的影响.结果表明:GR吸附四环素的去除率高达99.19%,随着GR投加量的增加,TC去除率随之增加,TC吸附容量逐渐降低,pH值对GR吸附TC无明显影响,20 mg·L-1的黄腐酸(FA)能够提高GR对TC的吸附容量.通过拟合动力学模型发现GR吸附TC更符合拟二级吸附动力学,说明GR吸附TC主要为化学作用吸附.通过拟合吸附等温线模型发现GR吸附TC更符合Langmuir吸附等温线模型,属于单层吸附.综合红外光谱表征
为提高舰船磁隐身能力,对舰船涡流磁场的深度换算进行研究,以满足消磁勤务的要求.首先,采用COMSOL仿真软件,使用有限元法进行铜板涡流磁场建模,通过外加磁场的改变模拟产生的两个深度涡流磁场,建立涡流磁场数据库;然后,在此基础上使用条件生成对抗神经网络(CGAN)对涡流磁场数据进行训练和学习,建立不同深度的涡流磁场推算模型.得到的模型对涡流磁场的推算准确度较高,训练结果较好,对实际的涡流磁场研究有指导意义.
在音频检索中为了利用音频水印进行信息标注,以及有效地权衡音频水印的嵌入容量、透明性和鲁棒性之间的关系,提出了一种基于双树复小波变换(DT-CWT)和奇异值分解(SVD)的鲁棒音频水印算法.首先提取原始语音的音频指纹作为音频水印;然后通过基于能量的嵌入位置选择来确定水印嵌入帧,进行4级DT-CWT后选取高频分量分段进行SVD;最后通过量化的方法在奇异值矩阵的奇异值中嵌入水印信息.实验结果表明:该算法具有较强的鲁棒性和透明性,并具有较高的嵌入容量,可以很好地满足信息标注的需要.