论文部分内容阅读
在现代科学技术迅猛发展的背景下,人们对图像的要求越来越高。高清晰度和高质量的图像是现代视觉信息数字化所追求的基本目标。但是,在图像的采集、处理、传输和存储的过程中,由于采集方法、处理手段、传输介质以及存储设备的不够完善,加上采集时物体的运动性和传输过程中的噪声污染等一系列因素,给图像造成一定程度的失真。因此,图像质量的正确评价具有非常重要的应用价值,并且,图像质量评价(Image Quality Assessment,IQA)的广泛应用,对个人服务、科学研究和工程应用等相关行业的发展产生深远的影响。在传统的图像质量评价模型中,人工提取了各种视觉特征用来预测图像的视觉质量。然而,在深度学习模型中,深度特征是通过卷积神经网络自动学习的。因此,如何融合这两种特征以获得更好的图像质量评价模型是一项非常有意义的研究。在本文中,提出了一种基于多特征融合的深度学习模型(MFNet),该模型同时考虑了人工特征和深度学习特征。人工特征提取图像的一些基本视觉特征,然后将其放在深度学习模型中,从而使模型可以进一步提取更深入的人眼视觉特性信息。在提出的模型中,除了在学习过程中提取视觉特征外,还提出了使用视觉显著性来对训练集中图像块的主观分数进行重分配的算法,利用图像的梯度边缘特征对最终的图像块分数进行加权。因此,该模型被命名为SG-MFNet。最后,在TID2013数据集上训练了该模型,并在其他三个数据集中进行了实验,验证了该模型的准确性。本文模型的创新性主要体现在:(1)该模型可以从人工特征和深度特征中学习失真图像的重要信息。这两种特征在表示视觉质量方面的作用是通过卷积神经网络自动确定的。(2)本文根据图像的显著性来对训练集中图像块的主观分值重分配。将显著性图划分为三个区域,既可以防止图像块产生较大的分值差异,又使得分值的调整更加合理。(3)在得到局部分数图之后,根据图像的梯度特征,将不同的权重系数分配给局部分数图中的不同区域。边缘区域具有较高的权重,这与人眼视觉的特性密切相关。