基于深度学习的图像超分辨率研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨率任务(Super Resolution,SR)是一个将低分辨率(Low Resolution,LR)图像转化为高分辨率(High Resolution,HR)图像的技术,对于图像技术的应用如医疗影像、视频监控等具有重要意义。大多数基于深度学习技术的SR模型通过卷积神经网络计算出HR图像。在模型中,将分辨率放大的模块称为上采样结构。目前大部分SR模型采用后上采样方法,该方法将上采样结构置于模型末端,使模型的主要重心都偏离在图像的LR特征学习中,难以直接学习到图像的HR特征。渐进式上采样结构用于解决该问题,但是该结构在模型过大时容易出现计算瓶颈,限制了网络深度。此外,现有模型没有考虑LR特征与HR特征之间的相互依赖关系。这些问题导致输出的图像具有相对较多的噪声。现有研究为了追求图像真实性的提升而与GAN结构相结合,但是对于渐进式上采样这种多输出的结构,目前还没有SR模型同时对该结构输出的所有分辨率图像运用判别器网络,使得该结构难以在保持多分辨率图像输出的同时提升所有图像的感官质量。针对以上分析,本文对超分辨率的模型结构进行研究,具体研究工作如下:(1)本文对后上采样结构进行了改进,将其重构层的上采样模块改造为渐进式上采样结构,并提出模型BP-ELAPSRN。该模型具备了渐进式上采样结构的优点,同时减缓了该结构容易出现的计算瓶颈问题。然后,为了加强渐进式上采样结构中每一个分辨率特征之间的相互依赖性,该模型在所有上采样层中引入了反向投影(Back Projection,BP)机制,该机制通过计算高分辨率特征与低分辨率特征之间的残差并对自身作出反馈,能够不断优化上采样后的特征,进一步提高模型的性能。(2)本文引入GAN结构并提出模型BP-LAPGAN。该模型对判别器网络进行了改进,使其能够应用于渐进式上采样结构中所有分辨率的输出图像。此外,该模型通过多个分辨率图像的反馈能够进一步强化感知特征的学习能力。本文通过对比实验表明,BP-ELAPSRN和BP-LAPGAN与前沿的SR模型相比在性能与视觉感官上都有了有效提升。最后通过目标识别任务的实验表明,该模型能够有效地运用于其他的计算机视觉任务中,具有重要的研究意义。
其他文献
随着科技的发展,室内机器人、虚拟现实、增强现实等新兴应用逐渐走进人们的生活。基于视觉的同时定位与建图(Visual Simultaneous Localization and Mapping,V-SLAM)技术在其
与分布式电源相关的电气设备正逐步走向成熟,可广泛应用并接入配电网进行供电,将配电网从传统的配电网(被动、径向开环运行)改为智能配电网(主动的、封闭的电网操作),接入分
饲料行业在我国兴起至今已有近四十年的时间,我国养殖户的水平逐步提高,从最初引入中国的预混合饲料,随着行业发展及养殖技术提升,全价配合饲料逐步提高比重,现已占到了市场
在如今这个经济环境变幻迅猛的年代,越来越多人都开始意识到人才对企业的重要性,一个企业成立后的每一天都离不开人才的支持,一旦有人才大量的外流,企业就很可能因此一败涂地
作为具有代表性的新型含氮杂环类杀菌剂,吡咯类杀菌剂氟咯菌腈具有高效、低毒、持效期长、耐受性好等特点,其主要活性基团为苯并胡椒环上的氟原子和氰基吡咯结构。为寻找具有更高生物活性、更环保的新农药杀菌剂,本文基于氟咯菌腈设计并合成了 1 1个新型吡唑联吡咯类杂环化合物,以吡唑环代替氟咯菌腈上原有的苯环,以期提高其杀菌活性。通过大量实验确定了以乙酰乙酸乙酯和甲基肼为起始原料,经环化、甲酰化、取代、缩合、再
近年来,深度学习技术推动了计算机辅助诊断在医学影像分析领域的快速发展。与传统基于人工设计的特征提取算法比较,深度学习方法在图像分类,检测和分割等任务方面的性能显著
时间序列是现实世界中一种重要的数据表现形式,广泛存在于不同应用领域,如城市交通、电网电力和金融市场等等。由于现实世界存在不可控因素,如操作失误、设备故障和通信错误
随着时代的进步,我国航运业的发展也日趋成熟,做为海上交通行业,航运业具有一定的特殊性,其成本组成较一般行业而言也有很大的不同,在成本控制方面也存在较大的局限性,成本控
党的十九大报告多次指出,我国城乡区域发展和收入分配差距依然较大,必须着力加以解决。由于收入极化比收入不平等带来的后果更加严重,因此有必要从收入极化角度对我国城乡收
资产证券化(Asset-backed Securities,即ABS)是将缺乏即期流动能力、但是之后能够产生较为稳定且能够预测的现金流的资产,通过证券化操作转化为市场上可流通的证券,由投资者