基于特征强化生成对抗网络的图像去模糊研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:bloodt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人们从外界获取和交换信息的重要来源,然而图像采集过程中通常存在物体运动、相机抖动等因素,造成采集图像模糊失真,严重影响了图像观赏的舒适度和满意度,给后续图像分析理解带来极大障碍。因此,从失真的图像中恢复出清晰可观图像的去模糊技术研究极为重要。近年,基于深度学习的方法大多通过增加网络复杂度来改善去模糊效果,虽然使效果得到了提升,但却增加了算法的运行时间。有时也不可避免的引入了伪影,且可能无法处理复杂的运动模糊。针对运动图像去模糊问题,本文以生成对抗网络为研究基点,主要以自然图像的运动模糊为研究目标,提出一种基于特征强化生成对抗网络的去模糊方法,旨在通过以强化图像特征提取的方式来帮助提升模型性能。本文的主要研究工作如下:(1)本文详细分析了现有的去模糊方法的基本原理和特点,得出了去模糊效果在特征提取方面还有提升空间的结论,因此,本文主要对图像去模糊的特征提取技术进行深入研究。(2)为了使网络能够捕获更加复杂的特征,提出了基于双域思想和具有空间连续可学习激活函数的特征提取模块。一方面针对单纯在空间域进行特征提取会产生过多的信息损失这一不足之处,在特征提取部分通过具有互补性质的空间域和频率域双域卷积来进行特征提取,从而提升网络性能。另一方面联合空间相关性实现了一个非线性可学习的激活函数,与传统的逐像素激活单元不同,该激活函数通过增加非线性特征映射的密集度,使得网络在具备相同性能的情况下,能够采用更少的网络层次。最后实验结果显示,该方法对网络模型性能的提升是有很大帮助的,是一种有效的特征提取技术。(3)为了进一步改善图像去模糊效果,结合上述研究策略,通过引入多级残差学习思想和亚像素卷积层,提出一种基于特征强化生成对抗网络的去模糊研究方法。我们进行了大量的实验,且使用不同拍摄设备采集了一组真实世界的模糊图像数据集,来验证提出的方法对真实世界图像去模糊研究的有效性。与其他方法的相比,本文中的方法可以从合成和真实世界的模糊图像中恢复出更清晰和更详细的图像。本文针对图像去模糊方向,重点研究了图像处理过程中的特征提取方面的问题,提出了一种基于双域卷积和具有空间连续可学习激活函数的特征提取策略,同时结合多层次残差学习思想和像素重组技术对生成对抗网络中的生成器结构进行整合,最终提出本文的图像去模糊研究方法。通过大量的实验定性定量评估与分析,在GoPro测试数据集上的PSNR值达到了31.13,SSIM值为0.9420,结果表明本文方法取得较好的结果。
其他文献
JavaScript是一种流行的、平台无关的编程语言,为了保证JavaScript程序在不同平台上的互操作性,JavaScript解释器(即引擎)的实现必须符合ECMAScript-262标准。然而,标准的频繁变动使得引擎开发者往往难以做出及时的更新,从而使JavaScript引擎出现不符合标准的行为,即一致性缺陷。一致性缺陷不但会导致正确的JavaScript脚本在运行后得出错误的结果,还有可能
书法是中国汉字特有的一种书写载体,从甲骨文、金文、隶书等逐渐发展变化出楷书、草书、行书等书法。现今,使用纸张和碑刻作为书法作品传承的载体非常不易保存。氧化、虫蛀、风蚀等自然因素和战乱、损毁等人为因素都对书法作品保存造成了非常大的影响。所以,使用现今的科学技术对中国的书法古籍和碑文等进行虚拟修复和是非常有意义的工作。在计算机视觉领域中,使用卷积神经网络进行分类和特征提取,使用生成式的神经网络进行图像
化石图像作为化石标本的信息载体,是古生物学者之间讨论古生物分类学和系统学的重要依据。准确且自动化的化石图像检索,不仅有助于古生物学者建立生物演化关系,而且有助于古生物爱好者学习古生物知识。虽然使用常规计算机图像领域的方法可以对化石图像进行自动化识别和检索,并可以有效减轻化石图像检索过程中的错误率和主观性,但是,存在两个主要的问题:一是真实的化石图像数据量不足,导致模型泛化性能低;二是化石图像中主体
人机对话(Human-Computer Dialogue)是人工智能的重要应用之一,其特点是可以自动地生成对话回复与人进行交谈,而备受研究者的关注,其目标是希望生成的对话回复语句更加多样,富有情感,贴近人类的真实对话。在对话生成领域中,研究人员开始使用Seq2Seq模型进行实现,取得了一定的进步,提高了模型的适用性,但由于对话语境的复杂性,主要存在以下缺点:模型容易生成通用回复,语句质量较低,会导
随着社会发展,数据类型愈发多样化,时间序列数据是随时间变化生成的一系列连续实值,通常在时间上存在前后关系,它的特点是数据量大、数据维度高以及随时间变化更新。对时间序列数据进行分类是数据挖掘领域重要研究内容,考虑到时间序列数据通常是在一段子序列中表现出类别之间的差异,因此shapelet作为具有较高区分度的子序列也就引起重视。基于shapelet的时间序列分类算法具备可解释性、分类速度快、分类准确率
情感分析是自然语言处理中的基本任务,属于文本意见挖掘范畴,是指对文本数据进行清洗、处理、提取相关特征并计算判断文本蕴含的情感倾向,为各项决策提供依据,被广泛应用在舆情分析、经济发展、法制建设和推荐系统等方面。大量学者对情感分析任务展开研究,已经取得了一定的成果,但仍存在一些挑战。如静态词嵌入方式由于一词多义问题致使提取的特征存在偏差;传统的卷积、循环结构的深度学习网络无法对文本整体进行处理导致特征
随着可视化技术的不断发展,越来越多的地理地质领域的可视化平台不断地进入大众的视野。这些系统的兴起和大量的应用使得越来越多的地理地质科研工作者观察及分析数据更直观,工作效率更高。随着研究的不断深入,研究对象的周期不断增加,因此会产生更大规模的地形信息,更高精度的模型实时渲染和可表达数据连续性的可视化成为了需要解决的问题。因为地形地壳的数据体量庞大,现有的可视化方法不能够高效的对大体量数据进行建模,同
随着大数据时代教育信息化的进一步到来,如何通过大数据分析和现代化人工智能技术自动认知与准确理解教师和学生在课堂中出现的种种行为,并从中准确判断出学生的课堂参与情况,从而对课堂教学质量和学生学习效率进行综合分析是目前亟待解决的问题。在以往的传统课堂师生行为分析研究中,大多只针对课堂师生的言语行为进行种类划分,而忽视了非言语行为在课堂教学中的重要性。并且在判断学生课堂参与情况时,往往只单独根据学生的某
X射线发光断层成像(XLCT)作为一种新型混合成像技术,利用X射线深层激发稀土纳米颗粒,发射近红外光,可以同时采集生物体空间结构信息和表面荧光信息,为深度组织成像提供了可能性。XLCT具有高穿透性和高空间分辨率的优势,在肿瘤早期检测,药物代谢追踪等领域具有临床应用价值。然而由于生物组织中光的散射和吸收作用,XLCT的重建是一个病态不适定问题。因此,高效、鲁棒的重建算法一直是X射线断层成像的研究重点
寒武纪是人类历史长河中不容忽视的一部分,其遗留下来的化石成为了现代人观察和研究寒武纪生物大爆发以及进化发展的可靠依据,随着当前古生物研究领域中化石模型使用率的逐渐增高,也暴露出了模型重建难度大、价格昂贵、过程繁琐以及耗时长的问题。本文通过化石的光学多角度图像,对古生物化石的三维重建方法进行了研究,以下为研究内容:(1)针对目前化石重建过程繁琐问题,通过对光学重建方法的比较,选择从运动中恢复结构(S