基于偏微分深度网络的图像去噪方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fuchengjun007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像去噪作为一种计算机视觉、图像处理领域的基础性任务,在生产制造、医学健康和卫星遥感等领域具有重要的应用价值。图像去噪是一种逆问题,其目的是从噪声观测中估计出未被噪声污染的图像,实现图像质量的增强,继而使后续的图像处理、分析等环节免受噪声影响。在过去几十年,基于不同理论的图像去噪方法相继被提出。其中,传统方法原理清楚、计算简单,然而去噪效果不够理想;基于神经网络,特别是深度神经网络的方法,近些年在图像去噪领域取得了长足的进展,但其参数规模较大,网络的训练亦需大量数据和时间;基于偏微分方程的图像去噪方法物理意义明确,参数规模小,然而其结果往往依赖方程的参数,泛化性有限。鉴于此,本文结合深度神经网络,研究数据驱动的偏微分方程及其在图像去噪领域的应用,探索图像去噪背后隐藏的物理意义,实现高效、可解释的图像去噪方法。论文的主要工作和创新点具体如下:(1)提出了一种基于偏微分深度网络的图像去噪方法。基于回归方法构建了深度偏微分网络,基于动态时间规整设计代价函数,实现常系数微分方程的学习并将其应用于图像去噪。具体如下:1)基于回归方法构建具有多层结构的偏微分深度网络,引入动态时间规整算法设计损失函数,解决了预测值与真实值数据量不平衡问题;2)引入迁移学习的思想,将在数值解上预训练的网络参数迁移到真实数据上,实现了对真实图像去噪过程的学习;3)将噪声图像作为偏微分方程的未知函数,通过网络前馈过程实现图像去噪。实验证明,该网络能够学习真实数据中隐藏的偏微分方程,将其应用于图像去噪亦可取得了具有竞争力的结果。(2)提出了一种基于变系数偏微分深度网络的图像去噪方法。针对图像细节在去噪过程中容易丢失的问题,结合U形网络构建了变系数深度神经网络,引入交叉熵设计了代价函数,实现了变系数偏微分方程的学习并将其应用于图像去噪。具体如下:1)引入U形网络,构建变系数偏微分深度网络,同时设计新的训练方式,增强了网络对图像特征的表征能力;2)引入加权交叉熵损失,设计新的软时间正则化距离方法作为损失函数,提高了网络训练的稳定性和对图像特征学习的精确度;3)对噪声图像分块解构,相似块分组去噪后进行聚合操作,进一步提升图像去噪的效果。实验证明,该网络能够逐像素学习真实数据中隐藏的变系数偏微分方程,将其应用于图像去噪可以更好地保持图像中的纹理和细节。综上所述,本文针对微分方程学习和去噪效果提升两个问题,采用偏微分方程驱动图像演化从而实现图像去噪,研究了基于偏微分深度网络的结构设计、代价函数设计、网络训练方法以及基于该类网络的图像去噪方法,提出了基于偏微分深度网络和基于变系数偏微分深度网络的两个图像去噪方法。以上方法具有深度神经网络和偏微分方程两类方法的优点,可以自主学习偏微分方程的系数,省去人工配置参数的时间,同时网络参数量少,放松了对训练数据的要求,训练效率高;偏微分深度网络可以在少量时间样本数据下进行偏微分方程的学习,且校正了数值求解器的误差,提高方程解的精确度,网络的可解释性强。本文研究为偏微分方程学习与图像去噪领域的研究提供新思路,推广了偏微分方程的应用,促进了图像去噪领域物理意义的探索。
其他文献
随着传感器和计算机技术的发展,人们见证了信息的超载和数据特征的爆炸式增长。通常这些数据具有数千甚至数十万个维度,严重制约了现实视觉任务的计算效率。为了解决这一问题,学者们提出了许多特征表示方法来挖掘数据中真正有用的信息。本文立足特征表示学习领域,分别围绕子空间学习、多视角学习和小样本学习任务,研究具有更高识别率的分类算法。论文所取得的研究成果如下:首先,针对基于协作图的判别分析(CGDA)没有充分
学位
医用射频消融技术是一种将射频电子电路技术和医疗科学相结合的技术,利用交变电流导入人体时产生的热效应达到切割、凝血、消融等不同效果。该技术具有微创、显著减少出血等优点并被广泛应用于各类肿瘤治疗与呼吸道治疗中。目前市面上实际应用的医用射频消融设备以欧美、日韩等国的品牌为主,国内相关设备的研发起步较晚,并存在一定的问题。因而,研发具有自主知识产权的高精度医用射频消融技术具有重要意义。本文首先对射频电信号
学位
基于深度学习的医学图像分割算法往往需要大量的标记样本用于网络训练。然而,医学图像的像素级标记成本较高、难度较大,且需要具备专业知识。这导致目标域中通常不存在手工标注的样本。并且,由于医学图像的异构性与复杂性,来自不同成像设备的数据之间存在分布差异,这种分布差异构成的域偏移会使得在源域上训练得到的分割模型应用于目标域时的性能发生退化。利用迁移学习的思想,将源域中的知识迁移到无标记的目标域上,是解决以
学位
伴随着人工智能技术的日渐成熟,“智慧城市”这一词汇逐渐被人们所关注。图像的语义分割作为计算机视觉领域中的重要任务之一,在建设“智慧城市”的进程中起到重要作用。比如,在自动驾驶领域中对传输图像进行语义分割帮助车辆进行路线的规划;对飞机着陆前拍摄的俯视图进行语义分割辅助飞行员安全着陆。近年来,基于卷积神经网络的方法在语义分割问题上取得了一系列突破,主流的语义分割网络通常基于编解码器结构。但在大部分语义
学位
随着电子信息技术等相关技术的发展,视频已经逐渐成为生活中不可或缺的信息媒介。当前各种数字环境中存在的海量视频数据具有着极大的价值,因此,利用计算机进行视频的内容理解、信息挖掘已经成为研究者的重要课题。近年来,深度学习在图像处理等领域取得了前所未有的成功,这也促使了基于视频的人体行为识别技术的发展。目前行为识别领域还存在着诸多挑战,比如人体行为在类内和类间均有较大的变化,不同视角、不同速度下的同一类
学位
近年来,随着计算资源以及数据规模的大幅增长,深度学习取得了前所未有的成功。在多个领域和多种任务上,如图像识别、语义分割、文本分类、语音识别、多模态学习等,深度学习都发挥了举足轻重的作用。然而最近的一些研究发现,对抗样本广泛存在于各种深度学习领域,给深度学习系统的现实应用带来了巨大的威胁,尤其是一些安全性敏感的深度学习系统,如自动驾驶、行人重识别、智慧医疗等。对抗样本是一些在自然图像上添加人为构建的
学位
近年来,以深度卷积神经网络(Deep Convolutional Neural Network,DCNN)为代表的人工智能技术迅速发展,在图像识别等特定领域的性能已经接近甚至超过以人类为代表的灵长类动物。然而,在目标/背景复杂多变、遮挡和干扰等复杂开放场景下,DCNN模型的性能容易急剧下降,而灵长类动物仍能快速、准确、稳定地识别目标,这表明现有的DCNN模型在数据驱动的模式下,还很难像灵长类动物大
学位
视频时空定位任务是计算机视觉和自然语言处理技术两个领域的交叉融合,可被广泛地应用于安防监控、视频检索等领域。关系时空定位和多句式查询文本的目标时空定位是视频时空定位任务中的两个新兴的研究分支。现阶段的关系时空定位方法利用目标空间特征构建目标之间的动态关系特征,通过信息的单向传递定位符合关系的多目标时空轨迹,然而其忽略了信息的双向传递对定位的指导作用,且错误的信息在单向传递过程中难以被矫正。同时,现
学位
近年来,随着深度学习技术的迅速发展,基于有监督学习的方法在各种视觉任务上达到了很好的性能。然而,这类方法依赖于大量有标签的训练样本,学习得到的分类器往往能够较好地识别训练过程中见过的样本类别,而无法很好地迁移到训练中未见过的其他样本类别。为了解决这种缺少有标签数据的学习任务,零样本学习(zero-shot learning)受到广泛关注,即一个神经网络模型将在已知类别的样本数据上学习到的知识迁移到
学位
现代军事战争大多发生在复杂地、海环境中,目标所处背景对于雷达探测与识别的影响不容忽视。通常将目标所处背景看作是单层介质粗糙面,只研究粗糙面与上方目标的电磁散射问题。但是实际中的自然环境组成复杂,如植被覆盖的土壤、雪层覆盖的土壤、溢油海面、浮冰海面等通常为多层介质。在研究时,除了粗糙面与上方自由空间的散射问题,对于上层和下层粗糙面之间发生的电磁波透射问题也要重视。对分层粗糙面与目标复合电磁散射进行研
学位