基于深度学习的图像质量评价算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wyattwong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现今信息时代,数字图像作为信息交流的重要载体,在交流的过程中发挥着非常重要的作用。但是由于一些客观原因的存在,图像处理系统中的图像会损失部分信息导致图像的质量降低,影响到后续的图像处理工作以及人类对图像信息的接收。而图像质量评价研究如何评价图像的质量变化,是一个十分有意义的研究课题,也是图像处理系统重要的组成部分。图像质量评价算法可按照图像类别的不同分为2D图像质量评价算法(2DIQA)与立体图像质量评价算法(SIQA)。顾名思义,这两类图像评价算法分别作用于平面图像与立体图像。按照评价者不同,图像质量评价算法评价可以分为主观图像质量算法与客观图像质量评价算法两大类。主观图像质量评价算法是由人按照其主观感受对图像的质量进行评价,而客观图像质量评价算法则是由机器通过建立评价模型来获取图像的质量。本文首先对图像质量评价算法进行介绍,并分析了2DIQA与SIQA面临的挑战。在2DIQA领域中,近些年随着深度学习的发展,出现了很多基于深度学习的图像质量评价模型,但是现有模型在小数据量环境下很容易出现过拟合问题。而在SIQA领域中,视差以及其它的立体视觉特性将极大程度地影响着评价过程中的特征提取。针对以上两个领域中的问题,本文分别提出了改进的DIQa M_NR图像质量评价模型和基于shift-convolution的立体图像质量评价模型。1)一种改进的DIQa M_NR图像质量评价模型:本文采用迁移学习的方式对DIQa M_NR模型进行改进。改进后的评价模型使用Res Net50网络结构替代原有的特征提取层,并迁移出Res Net50网络在Image Net数据集上的参数,最后本文使用全局平均池化层(GAP)取代原模型中全连接层(FC-512)。改进后的评价模型比原模型的参数量低同时比原模型的网络结构更深。实验表明,改进后的评价模型即使在小数据量环境下也能够较好地模拟人类视觉系统(HVS)并能准确地评价图像的质量。2)基于shift-convolution的立体图像质量评价模型:该模型首先采用几层卷积层提取出立体图像的低级特征,随后使用shift-convolution层构建匹配的候选集,并计算初步的立体图像的视差信息。之后,该模型采用多个卷积层作为优化函数来优化候选集并提取更准确的视差信息。另外,现有的研究表明,左右视图的特征也对立体图像质量评价工作有着重大的影响。因此,模型采用了两个子网络从左右图像中提取与立体图像的感知质量有关的特征。在特征映射阶段,本文引入了GAP层对特征进行降维。最后,该模型将降维后的特征进行线性拼接,并采用全连接层来学习这些特征与立体图像质量之间的映射关系,输出该图像的质量。实验表明,该模型的准确率比绝大部分评价模型的准确率都要高。
其他文献
水声传感网络采用声波作为主要通信方式,是当今应用较为广泛的水下组网方式。然而由于水声信道具有长和多变的时延、窄带宽、多径效应等问题,水声传感网络的发展面临严峻的挑
癫痫(Epilepsy,EP)是一种常见的以短暂性中枢神经系统功能失常为特征的脑部疾病,具有反复发作和难以预测等特点。癫痫发作不仅严重影响癫痫患者的正常生活,而且给患者的家庭
为满足日益增长的终端设备的接入需求,802.11工作组提出IEEE 802.11ah标准来支持大规模设备的接入。然而,大规模设备同时接入网络,会导致严重的信道冲突。为此,802.11ah在媒
在写作的过程中,错误是很常见的。对写作纠错反馈的研究一直都是二语习得领域的一个重要问题。写作是学生必须掌握的一门技能,同时也是教师在英语教学过程中重要的一部分。在英语教学过程中,写作纠错反馈扮演了非常重要的作用,它也是学生输入的主要方法,也是语言输出的基本保证。书面纠正反馈的效果直接影响学生写作水平的提高,也反映了教师的教学效果。虽然国外关于学生写作纠错反馈的偏好与教师实践进行了大量的研究,但是中
目的:测量并根据右主支气管(RMB)长度,预测支气管封堵器(BB)用于左肺单肺通气(OLV)时的临床效果,为麻醉医师合理选择BB进行肺隔离提供理论依据。方法:选择择期行胸腔镜下右肺叶切除术的患者46例,ASAⅠⅡ级,男女不限,年龄3070岁,BMI 1929kg/m2。根据患者术前胸部CT扫描图像,利用气道多平面重建(MPR)技术测量RMB长度,将RMB长度≤1.5cm的患者纳入A组,将RMB长度
迁移学习自机器学习研究之始就备受关注,其旨在令算法获得如图人类举一反三一般的强泛化能力。领域适应是迁移学习的其中一个分支。给定两个相似性较强但样本分布不同的领域,
近年来,随着网络技术的蓬勃发展,数据以数据流的形式大量产生。对于数据流的研究受到越来越多的学者重视。与此同时,在传统的机器学习分类框架下,每个实例分配一个单独的标签
国家癌症中心发布的最新一期(2019年1月)的癌症统计数据显示,结肠癌(colorectal cancer,CRC)的发病率在女性和男性患者中分别位列第三位和第四位。虽然目前抗肿瘤治疗的发展迅速,手术,化疗,靶向治疗及免疫治疗等治疗手段的综合应用使结肠癌患者的生存期得到延长,但是,总的获益仍然有限,尚不能满足人们对于预后的期待。目前对于肿瘤的研究已经进入基因和分子水平。探索肿瘤发生发展过程中的分子
文字是人类社会信息传承的载体,充斥在人们的日常生活之中,但文字一般依附在图片之上,文本识别与文本检测则是将图片理解成为文字的关键性技术。其中,文本识别与文本检测被广
视觉注意力机制能使得人类快速将感知资源优先用于最关键的区域,帮助人类快速分析复杂的场景。显著性预测作为一种模拟人类视觉注意力机制的方式,对构建人机交互及辅助系统有