【摘 要】
:
视觉信息是大数据时代的主要数字信息资源,图像和视频是人类获取视觉信息的主要来源。人眼视觉系统是所有视觉信息的最终接收端,其本身就是一个复杂、高效的信息感知处理系统。因此,如何从图像和视频数据中迅速而准确地获得符合人眼视觉感知的信息成为研究的难点与热点。即以人眼视觉感知要求为准绳,研究如何有效提升计算机处理视觉信息和评价图像和视频质量的能力。总结起来,面向人眼视觉感知特性的图像质量评价可以看作大脑通
论文部分内容阅读
视觉信息是大数据时代的主要数字信息资源,图像和视频是人类获取视觉信息的主要来源。人眼视觉系统是所有视觉信息的最终接收端,其本身就是一个复杂、高效的信息感知处理系统。因此,如何从图像和视频数据中迅速而准确地获得符合人眼视觉感知的信息成为研究的难点与热点。即以人眼视觉感知要求为准绳,研究如何有效提升计算机处理视觉信息和评价图像和视频质量的能力。总结起来,面向人眼视觉感知特性的图像质量评价可以看作大脑通过视觉系统指导底层视觉信息的提取与处理过程,即在满足人眼视觉感知特性要求的条件下,对图像/视频的清晰度、数据量或深度感知等方面进行的视觉分析和质量评价,可用于指导视觉信息采集、编码、压缩、重构、处理和显示等一系列问题。本文从人眼视觉感知特性出发,重点探讨了视觉感知对图像的分辨能力、视觉感知对图像质量的综合体验、以及视觉系统对3D视频的立体深度感知,并研究其在数字图像处理中的建模应用。在视觉感知过程中,由于人眼视觉的分辨能力有限,无法分辨处于一定阈值下的视觉内容变化。恰可识别差阈值正好表征了这一视觉感知分辨能力,可有效去除图像冗余信息,从而提高图像的压缩编码性能。视觉感知后期,图像质量可以决定主观视觉对图像内容的认知充分性和准确性,而图像超分辨致力于图像内容的重构与恢复,因此超分辨图像的客观质量评价能够预测主观视觉对图像内容重构的综合体验,可用于评价和优化超分辨算法的性能。以及人眼双目视觉系统具有立体深度感知特性,对3D视频的深度质量评价可以反映人眼视觉系统对立体深度信息的感知能力,可用于3D视频压缩和编码等处理系统。总之本文由以下三个主要研究工作构成,即图像恰可识别差阈值估计、超分辨图像质量评价和3D视频深度质量评价,具体研究内容和贡献如下:(1)面向人眼视觉感知过程中的视觉敏感度方面,重点研究了人眼视觉的方位选择性机制,提出了一种计算图像内容结构复杂度的算子;然后根据人眼对不同结构区域的视觉敏感度差异,估计不同区域的掩模效应。再结合视觉系统随离散余弦变换Discrete Cosine Transform(DCT)域系数频率变化的对比敏感特性和亮度自适应性,提出一种新的DCT域恰可识别差阈值模型。本研究所提出的模型相较于其他DCT域恰可识别差阈值模型,有两个方面的创新突破。首先,所提的基于方位结构复杂度的掩模模型,相比于以前的对比度掩模,在对不同视觉内容的掩模效应估计上更加准确,也更加符合人眼的主观视觉感知。然后整个恰可识别差阈值估计过程完全基于DCT域系数,无需跨像素域操作,可直接应用于图像的压缩编码系统中,在提高阈值估计准确性的同时,保证了实用性。(2)面向人眼视觉感知后期对图像质量的综合体验方面,重点讨论了超分辨图像的性能评价指标如峰值信噪比Peak Signal to Noise Ratio(PSNR)和结构相似性Structural Similarity Index(SSIM),越来越难以满足现有基于深度学习超分辨算法的性能比较问题。本文首先组织了超分辨图像质量的主观评价实验,构建了一个可靠的超分辨图像质量评价数据库,验证了现有客观评价指标在超分辨图像质量评价上的缺陷。然后根据自由能量理论,基于大脑的内部生成机制,提出一种视觉内容预测模型,用于预测不同视觉区域内容的纹理和结构特征。最后通过计算超分辨图像和参考图像视觉内容预测模型的相似性,提出了一种专门用于超分辨算法性能比较的客观质量评价指标,提高了其与主观视觉感知的一致性,可用于指导超分辨算法的设计与优化。(3)面向双眼视觉感知特性的立体深度质量评价方面,针对3D视频立体深度感知可能受编码等外界噪声因素影响的问题,我们通过组织一系列的主观深度感知评价实验,探究视觉系统的深度感知与频率、方向和运动等基本视觉元素的相关性;然后结合深度感知特性和时空域的结构特性,分别提取3D视频的双目、单目和运动深度特征进行建模;最后在3D视频深度感知评价数据库上,用支持向量机训练获得一个3D视频深度质量评价模型。本研究主要贡献是构建了一个用于3D视频深度质量评价的数据库;提出了一种3D视频深度质量的评价体系,即从双目、单目和运动三个方面估计深度感知特征;实现了3D视频深度质量的无参考评价,在主观深度感知一致性比较中,优于现有的深度质量评价指标,更加符合人眼的深度感知。
其他文献
在杂波背景中获取感兴趣的目标,一直是雷达信号处理领域的热点问题。随着雷达探测环境愈加复杂,雷达系统设备愈加先进,雷达杂波的统计模型趋向于多样化。实际中,许多实测杂波数据的统计直方图均表现出重拖尾的特性,针对传统高斯杂波模型设计的检测器不再适用。此外,在一些复杂杂波环境中,由于孤立类目标杂波的存在,杂波虚警不可避免地出现在检测结果中,在检测之后需要设计合理的拒判算法来剔除杂波虚警。本论文在介绍、分析
激光在大气中传输,由于大气湍流扰动的存在,沿光束传输路径上的折射率分布随机变化,这将会导致光束的波前结构遭到破坏,进一步引起光束携带信息的损坏,甚至丢失。位相奇点光束与轨道角动量相关,由于可能的光束轨道角动量数理论上是无上限的,对其的研究在光通信中具有重要的潜在应用价值。位相奇点光束在传输的过程中,受制于湍流的影响,轨道角动量各模态之间将会发生串扰,不利于在接收端对光束携带信息的提取。本文目的是致
在2019年世界5G大会上,以5G技术为支撑的一系列新兴业务不断涌现。其中,数字城市、无人机救援、5G远程驾驶和远程医疗等构想,俨然搭起一座充满无限可能的未来之城。为了实现5G宏伟愿景,四个主要场景备受青睐:无缝广域覆盖、高速率大容量、低功耗大连接和低时延高可靠。面对未来移动网络数据需求的爆炸性增长,如何提升频谱效率和能量效率是5G部署的重要目标,故现有无线传输方式和组网技术均需突破性创新。面对海
装备相控阵雷达的飞机可以灵活、快速地部署,实现对战场中各种目标的检测、跟踪,感知敌方态势,为己方力量的指挥和控制提供情报支撑。但是在机载雷达工作当中,必须解决干扰抑制和杂波抑制问题。在信号处理的环节,可以利用自适应波束形成技术来抑制旁瓣区域的干扰。但是当阵列流型与实际情况不一致(如存在位置误差、幅相误差或接收机通道响应误差),自适应处理往往导致期望信号的输出信干噪比下降。因此设计稳健的波束形成器来
多目标跟踪技术是信息融合领域的重要研究内容之一,已广泛应用于空中侦察与预警、导弹防御、战场监视等军事领域,以及计算机视觉、空中导航、交通管制等民用领域。然而,随着现代高分辨率传感器的快速发展以及跟踪场景的日益复杂化,所获得的目标量测信息更加丰富,致使多目标跟踪中的数据关联问题变得更加复杂。随机有限集(Random Finite Set,RFS)理论为多目标跟踪提供了新的发展契机,但最新的RFS滤波
网络安全分析根据网络主机基数、网络流和网络行为等安全参数,分析网络通信的变化趋势,进而判断网络的安全性,是维护和保障网络空间安全的重要技术。然而,随着网络规模的不断扩大,海量安全参数导致网络安全分析面临效率低、准确性差、资源消耗大的问题。近年来,数据压缩融合方法已被广泛应用在网络安全分析中,通过按需压缩和融合数据,减少存储及分析数据所需的资源消耗,具有时间和空间上的优势,是克服海量安全参数给网络安
随着互联网的进一步普及以及数字多媒体技术迅速发展,全球已经进入大数据时代。网络数据体量呈爆炸式增长,数据传播形式由单一文本发展为包含文本、图像、视频、三维模型等多媒体数据。如何有效地对庞大的多媒体大数据进行存储和分析,为用户提供感兴趣且类型丰富的媒体数据,已经成为学术界及工业界高度关注的重要问题。跨模态哈希技术,通过机器学习紧凑哈希编码的方式对多媒体大数据进行管理与分析,具有存储空间小、检索速度快
光场相机的出现,是计算成像领域的一个革命性进展。光场相机突破了传统相机只记录光线强度的局限,同时记录光线的方向和强度信息,通过信号处理算法可以实现先拍照后对焦、精准虚拟视点合成等众多功能,在计算机视觉、计算成像、机器人等领域具有广泛的应用前景。几何标定是光场相机各项应用算法的基础,内外参标定参数的精度直接影响了各项应用的性能。内外参标定是光场相机领域的研究热点,近年来在投影模型、图像特征提取、标定
氮化镓(Gallium Nitride:GaN)具有禁带宽度大、击穿电场高、热导率高、电子饱和速率高等优越性能,还能与氮化铝(Aluminum Nitride:AlN)或氮化铟(Indium Nitride:In N)等其它Ⅲ族氮化物形成直接禁带半导体合金材料,禁带宽度可从0.65到6.2 e V之间任意调节,在光电器件和电子器件等领域扮演着极其重要的角色。此外,Ⅲ族氮化物具有很强的压电极化和自发
海面目标检测是雷达目标探测的一个重要分支,也是雷达系统设计的基础和前提,在军事和民用领域都具有重要的研究意义。杂波是制约雷达目标检测和跟踪性能的关键因素,对于杂波特性的研究始终是雷达领域的热点。随着雷达分辨率的提高,传统检测方法并不能满足现役装备的需求。因此,本文着重研究了海杂波和目标多维度的特性差异,以及它们在海面目标检测中的应用。论文的主要研究工作如下:1.杂波模型的参数估计直接影响着高分辨长