基于密集判别与注意力特征传播的细粒度图像修复

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:lives63712094
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像修复是指根据图像未破损区域的已知像素,推断并重建图像破损区域像素的过程,在图像编辑、图像渲染以及机器人定位方面有着重要的应用。随着深度学习的兴起,图像修复技术在修复性能方面得到了巨大的提升;但在具有挑战性的图像修复任务中,当前方法仍然存在不足。本文深入分析并研究当前代表性方案在图像修复网络框架设计上的缺陷,以及当前代表性方案在图像修复效果方面存在的细节模糊与结构错误问题。进而针对细节模糊与结构错误的问题,提出两个端对端网络框架,实现图像修复结果在结构与细节上的共同提升。本文的主要工作包括:1.深入研究当前三种代表性的图像修复算法:CE(Context Encoders:Feature Learning by Inpainting)、CA(Generative Image Inpainting with Contextual Attention)和MC(Image Inpainting via Generative Multi-column Convolutional Neural Networks)。其中CE为基于深度学习的图像修复算法中最为经典的算法之一,首次成功实现采用自动编码器的编-解码过程建模大破损面积的图像修复过程,并将生成对抗网络(Generative Adversarial Networks,GAN)引入到图像修复框架中。在CE的基础之上,CA通过引入扩张卷积以及由粗到细的两阶段生成网络结构扩大编-解码器结构生成网络的感受野。同时,CA提出基于注意力匹配与替换的特征提取方法,使得CA在不需要后处理的情况下依然能得到优秀的图像修复结果。与CA不同,MC将图像修复建模为多列生成,在不规则及规则掩码条件下都取得良好的效果。通过对上述代表性方法进行包括论文复现、实验结果分析等研究,本文发现这些方法的结果普遍存在细节模糊与结构错误的问题。从网络设计的角度分析这些方案,本文认为细节模糊是网络约束能力不足造成的,结构错误是由于网络特征提取能力低下造成的。针对代表性图像修复算法的不足,本文提出针对这些不足的改进思路。2.针对当前图像修复算法存在的细节模糊问题,提出基于密集判别的图像修复算法。从第二章对主流代表性方法的研究与分析可知,当前图像修复方法所存在的细节模糊问题主要是修复网络对图像生成的约束能力不足造成的。本文通过提高两方面的网络约束来克服约束不足的问题。1、密集判别约束。提出的基于密集判别的图像修复算法直接对生成器的重建结果进行密集全局与密集局部判别,而非对重建结果进行简单的全局判别以及局部判别。密集全局与密集局部判别对图像的重建过程进行的强约束,大大促进图像细节的重建。2、边缘约束。为实现结构细节的更精确重建,本文还提出一种边缘损失,将边缘空间内的生成图像与其对应的真值图像进行损失求解,提高图像边缘的重建质量。密集判别约束与边缘约束结合,克服当前方案所普遍存在的模糊问题。实验结果表明,相较于当前主流代表性方法,本文提出的基于密集判别的图像修复算法有着更强的细节重建能力。3.针对当前图像修复结果存在的结构错误问题,提出基于多级注意力传播的图像修复算法。当前主流方法所采用的自动编码器网络存在“瓶颈区”过大的问题,制约结构信息从图像上下文到破损区域的传播,即“瓶颈区”过大造成了网络对结构特征提取能力低下。为此,本文提出将结构信息从图像上下文区域到破损区域的传播问题,解耦为多级注意力传播问题。将“瓶颈区”特征压缩到小尺度并提取注意特征,再将该小尺度注意力特征逐步传播到更大尺度。这种多级注意力传播有效解决了编-解码器存在“瓶颈区”过大的问题。实验结果表明,相较于当前主流方法,本文所以出的算法有着更加有优秀的结构重建能力。
其他文献
常染色体显性遗传性共济失调(autosomal dominant cerebellar ataxia,ADCA)是最常见的遗传性神经系统疾病之一,可累及小脑、脑干和脊髓,典型的临床表现为慢性进展性的步态不
2008年由美国次贷危机引起的全球金融海啸曾给世界经济带来重创,并引发了许多商业银行的破产倒闭,频繁突发的宏观经济冲击和日益积聚的金融风险对金融机构造成的负面影响远远
卷烟制假是一种严重扰乱经济秩序的违法犯罪行为,极大地损害了国家和消费者利益。制假分子制造假烟大多采用价格低、质量差的低等烟叶或等外烟叶作为主要原材料生产和销售假
在中美贸易摩擦等经济大环境下,传统的家居行业在近五年(2015-2019年)的产成品总额波动变化,尤其是2018年至今,我国经济下行压力增加,导致我国家居行业产成品总额有所减少。大数据、人工智能、物联网等“互联网+”相关热点俨然成为传统家居行业发展中无法回避的新技术和新应用。随着消费互联网发展逐渐进入成熟阶段以及持续的消费升级,以互联网推动实体产业全链条的转型升级是传统家居行业转型升级的重要机遇。
在全球应对气候变化的背景下,城市率先实现低碳转型和可持续的绿色发展逐渐成为国际共识。2019年,联合国发起名为“零碳竞赛”的气候行动,全球有454个城市参与。据不完全统计,目前已有102个城市承诺不晚于2050年实现净零排放。这些先锋城市纷纷制定规划和方案,从城市形态、空间规划、产业体系、能源体系、技术体系和生活方式等各个方面推动整个城市经济、社会的低碳转型发展。我国已向国际社会承诺2060年前实
苗族在少数民族中属于一个非常古老的民族,自古以来就生生不息的繁衍在中华大地上。苗族拥有着丰富多彩的民族文化、古老悠久的历史文化,是中华民族绚丽多彩的历史文化中最重要的成员之一。在少数民族人民居住的地区——广西百色隆林,坐落于鸡鸣三省区的贵州、云南、广西接壤地带,其中德峨有着近千个苗村和近百里的苗族土地,有着差不多10万苗族人口聚居的中心区域,也是苗族的文化中心。德峨苗族包括五大支系中的四大支系,有
2016年3月1日中国能源研究会在发布的《中国能源展望2030》报告中指出,我国在未来的很长一段时间内电力需求的增速将会放缓,电网的建设将会进入一个新时期。任何一个项目的建
近年来,铁路营运里程呈持续增长趋势。截止2019年底,全国铁路营运里程达到13.9万公里,较2018年年末增加0.8万公里。随着铁路营运里程的增加,乘坐火车出行的旅客也随之增长。学生客流是铁路春运和暑运的重要客流,对春运和暑运期间铁路旅客发送量的影响很大。自2012年实行网络购票以来,客票系统汇集了大量的旅客出行信息。目前广泛使用的铁路客票数据的分析方法多数局限于对数据信息进行简单的统计描述,缺乏
现如今,二维转台广泛应用在航天航空和空间探索领域,精密化、轻量化、小型化、负载大的二维转台需求较大,人们对二维转台温度特性、结构特性、控制特性的研究进行了深入研究。本文中研制的二维转台可以实现绕Z轴和Y轴的旋转运动,采用伺服电机进行运动控制,能够在负载较重的情况下提高对电机位置和速度的控制精度。论文的主要研究工作如下:(1)采用CREO软件建立了二维转台的三维模型。结合了现代增材制造技术与传统的加
东北是我国主要的粮食生产基地,而夏季是东北农作物的主要生长季,也是降水集中的季节,降水量的多少及其分布是影响东北地区粮食产量的重要因素之一本文利用1961—-2010年中国