基于残差学习的图像超分辨率重建

来源 :吉林大学 | 被引量 : 0次 | 上传用户:huahua_yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,由于信息科技的快速发展,人们对信号与信息处理的要求也越来越高,而图像处理又是信息处理的重要环节。通常图像信息需要通过降低分辨率来节省带宽,但这样处理后的图像并不能满足人们的实际需求。因此图像超分辨率重建(Super-Resolution,SR)技术就显得尤为重要,其原理就是对低分辨率(Low-Resolution,LR)图像通过信息处理的技术得到一幅高分辨率(High-Resolution,HR)图像。而卷积神经网络(Convolutional Neural Network,CNN)在图像超分辨率重建中是目前应用最为广泛的方法。最初的基于卷积神经网络的模型都是通过增加神经网络深度来取得更好的图像重建效果,但盲目的增加网络层数,会造成梯度爆炸,明显提高运算复杂度,增加网络的训练难度,并丢失图像细节。但随着残差学习的广泛应用,图像超分辨率重建不仅在重建质量上有所提高,在计算量方面也有了明显的改善。在这样的背景下,本文综合分析了现有图像超分辨率重建算法的一些优缺点,并且为了改善图像重建效果并减少计算量,降低网络的训练难度,论文进行了相关的研究工作。首先本文采用了一种结合全局和局部残差学习的图像超分辨率重建算法(GLRL),这种算法能够更好的学习图像的细节。采用堆叠的局部残差块(Local Residual Block,LRB)结构进行非线性映射,可以有效地克服图像的退化问题,由于在低分辨率图像与经过神经网络处理后的高分辨率图像之间信息高度相关,我们可以采用全局残差学习(Global Residual Learning,GRL)的方法将大部分的低分辨率信息用于高分辨率图像的重建。在前述方法的基础上,本文进一步采用了一种更快速的全局和局部残差学习相结合的图像超分辨率重建算法(FGLRL),主要目的是在几乎不影响重建效果的前提下进一步减小计算量,降低网络的训练难度。其原理是直接将低分辨率小图像送入到神经网络中,对其进行训练,而不将其进行放大处理,原因在于模型的计算复杂度会随着空间尺寸的增长而增长;提取特征后使用11′大小的卷积核来进行维度压缩,并在非线性映射后扩展维度,可以进一步减少模型的计算量;最后使用反卷积来进行上采样,将图片放大到所需大小。本文介绍了两种基于残差学习的图像超分辨率重建算法,实验表明利用堆叠的局部残差块和全局残差学习能够有效改善网络的重建效果,而使用压缩扩展维度和反卷积能够进一步有效降低计算复杂度。
其他文献
随着城镇化的不断推进,城市中基坑工程将会越来越多,面临的施工环境也将越复杂,这就使工程研究人员更多的关注基坑稳定性的研究。在现在的基坑工程设计与施工中,经济性和安全
FS团队由国内稀缺的休闲帆船航海船长从业者组成,致力于将帆船这一欧美流行的度假方式带回国内,设计了一款创新的境外帆船航海度假产品原型,在过去两年里小范围试运行,用以打磨出适合国人消费偏好及度假习惯的帆船产品,并收到了市场上的良性反馈。FS团队希望借此时机将该产品原型进行商业化,正式进入规模化运营。为了使企业步入商业化经营的轨道,FS团队迫切需要对海外帆船度假产品的竞争战略进行深入梳理和规划,设计出
本体作为语义网中表达语义信息的一种方式,一直是语义网相关理论和技术的核心。随着越来越多的本体在语义网上可用并且本体的描述变得越来越复杂,构建没有错误的本体也变得十分困难。造成本体错误的一个重要原因是本体中存在不可满足概念,这就会导致本体不协调问题。本体诊断是解决本体不协调问题的一个重要途径,而且本体诊断对于本体质量的保证起着关键作用,因此对不协调本体进行诊断具有重大意义。通常一个不协调本体可能包含
物联网技术被称为世界信息产业的第三次浪潮,目前已广泛应用于人类的生产生活当中,对异构物品进行编码标识及解析是实现物联网技术的前提。因此异构物品编码与解析技术是物联网领域的核心技术之一,更是将物联网技术广泛应用于其他领域的基础。在国际标准化组织及其他相关机构的共同努力下,物联网编码标准与解析标准的发展得以大幅推进。但目前还没有形成一个一致统一的编码与解析标准,各解析系统所采用的编码标准及信息服务接口
随着无线网络通信技术的快速发展,移动端在线视频服务已经成为了移动互联网的主流应用,并占据大部分的无线通信流量。与此同时,用户对无线网络下在线视频业务的体验需求逐步发生改变,单一的主观评分以及传统的视频体验质量(QoE)建模方案难以充分反映用户的实际体验质量。因此,构建符合当前用户需求的无线网络视频体验质量预测模型已成为当前具有挑战性的热点问题。本论文依托于国家自然科学基金面上项目“网络视频体验质量
目标跟踪技术是计算机视觉领域重要研究方向之一,广泛应用于交通、监控、军事等领域,有着极其重要的实用价值和研究意义。目标跟踪任务是指根据初始视频帧中目标的位置,预测后续帧中目标的位置坐标,并使用边界框对其进行标记。近年来随着科学技术的进步,目标跟踪技术得到长足的发展,涌现了一大批优秀的目标跟踪算法,但目标跟踪领域中运动模糊、低分辨率等难点仍未被很好地解决,因此复杂场景下实现对目标的鲁棒实时性跟踪仍是
近年来,铋基光催化剂,特别是含铋的氧化物的半导体光催化剂,由于其具有独特的层状结构和能带位置,展现出更加优越的光催化降解有机污染物的性能,因而引起了人们的广泛关注。
生活在二十一世纪的我们,步入到了一个科技高速发展的信息化时代。智能手机已经成了生活中必备的工具,我们通过它可以轻易地获取大量的数字图像。可以说,数字图像已经融入人们的日常生活中。然而,由于Photoshop、ACDsee等图像编辑工具发展迅速,人们可以很容易地对图像内容进行修改或者合成,而不留下任何肉眼可辨的痕迹。图像的真实性和完整性不能够保证,所承载的信息变得不再可靠。本文提出一种基于三维重建技
钻入地下的未爆弹、地雷等爆炸物种类繁多、分布情况复杂、危险性高,其阻碍土地的开发与利用,威胁民众的生命财产安全,尤其是在战争、武器系统定型试验中,各个试验场区、机场
随着互联网的迅速发展和应用普及,电子邮件的广泛应用给我们的生产和生活带来了相当的便利,但是便利的同时也带来了许多风险,邮件的安全性也受到人们的关注,尤其是在涉及保密等级比较高的单位,针对邮件安全问题本文以文本挖掘的方式,贝叶斯算法为理论基础,将理论应用工程实际,设计和实现了基于贝叶斯算法的邮件安全过滤系统。涉密邮件的过滤问题实际上就是电子邮件的分类问题,将文本挖掘技术应用于邮件过滤中,实际上就是用