基于深度学习的图像去运动模糊算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:conglishan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是自动驾驶、无人机集群智能控制等众多研究领域感知环境的重要信息来源。然而受成像设备、环境、人为因素(如相机抖动、相机与目标存在相对运动等)限制,图像运动模糊难以避免,极大降低了获取图像信息的质量和相关算法性能。进行有效的图像去模糊以恢复潜在清晰图像、增强图像数据的丰富度和可靠性,对开展后续研究有很大帮助。当前图像去运动模糊效果较好的方法主要基于深度学习,但该类方法仍存在模糊去除不充分、算法适应性不强等问题。本文主要针对单幅图像去运动模糊问题,分别在成对和非成对数据集上,以提升图像去模糊质量的同时减少计算量、增强算法在复杂环境下的适应能力为目标,开展高效、强泛化能力的深度学习去运动模糊方法研究,主要完成的工作和取得的成果总结如下:1.设计并提出一种新的多尺度残差图像去运动模糊特征提取模型,其中内嵌多尺度策略模块——多尺度残差单元(Multi-scale Residual Block,MResblock),具有多路多尺度特征提取通路。同时相邻尺度的特征通路加入维度拼接,进而在确保避免深度神经网络中信息丢失问题的同时更好地提取图像特征。相比于当前典型的深度学习图像去运动模糊模型,本文提出的特征提取模型处理得到的去模糊结果在图像评价指标——峰值信噪比(PSNR)和结构相似性指标(SSIM)上分别有0.39d B和0.0047的提升。2.提出了端对端的多尺度残差通道注意力图像去运动模糊算法,有效规避模糊核估计过程,直接学习模糊图像域到清晰图像域的映射关系。通过残差通道注意力模块,将图像的高、低频信息进行区别化处理,在注重处理高频细节信息的同时避免对大量低频信息所进行的冗余计算。与现有的代表性去模糊算法相比,本文提出的多尺度残差通道注意力的端对端图像去模糊算法在PSNR和SSIM指标上分别有0.79d B和0.0117的提升,算法运行速度有四倍提升。3.提出了基于循环一致性生成对抗网络(Cycle-Consistent Generative Adversarial Networks,Cycle GAN)的非成对图像去运动模糊算法,将图像去模糊问题建模为模糊图像域到清晰图像域的转换,采用两个生成对抗网络,分别实现模糊图像域到清晰图像域以及清晰图像域到模糊图像域的转换,两个网络构成数据转换闭环,通过约束转换后的输出图像与输入图像间的距离来定义网络损失函数,最终实现无监督的图像去运动模糊,能够根据所处理任务的特点,有针对性地构建训练集,算法模型更加灵活高效、适用范围更广。
其他文献
学位
随着军事武器装备和民用磁信息获取的应用需求提升,发展具有高分辨率、高灵敏度、高正交性的三轴磁传感器具有重要意义。TMR三轴集成磁传感器采用了“磁变轨”等技术,在提升分辨力、三轴正交性、线性度等性能指标上具有明显优势。然而,三轴磁传感器的小型化、集成化会产生轴间误差问题(具体来源包括轴间多物理场耦合、敏感体安装偏差以及轴间磁调控参数差异等),会降低磁传感器三分量解算精度。为此,本文开展基于TMR三轴
气敏传感器已广泛应用于空气净化、医疗等诸多领域,然而,气敏材料大多都难以兼顾多种气敏优良性能。如金属氧化物半导体材料,在应用时具有成本低、制造简单、灵敏度高、响应快、使用寿命长等优点,然而也具有工作温度高、选择性及稳定性差等缺点。因此,研究气敏材料性能的改良方法,探索新型的气敏材料十分重要。在本论文中,我们成功制备了无定型二氧化钛(A-TiO2)、钛酸铁及钛酸铜纳米材料,对所制备的纳米材料进行了表
学位
问答系统是自然语言处理领域的一个重要研究课题,随着人工智能技术的蓬勃发展,问答系统的研究也不断取得突破。作为一种高级形式的信息服务,问答系统与当前广为接受的信息检索系统相比,不仅可以支持自然语言交互,还可以直接返回答案语句,而非相关网页文档。因此,它能更好地理解用户的真实查询意图,在高效满足用户信息需求的同时,为用户提供更加精准的信息服务。答案选择,作为问答系统中的一个关键环节,正受到越来越多研究
学位
战场形势错综复杂、瞬息万变,能否在面对纷杂的环境要素时及时、准确、高效地识别敌战场意图,事关决策者对战场总体态势的把握,影响整场战争的格局和走向。本文首先详细分析和阐述了战场意图识别的定义、研究意义和应用前景,将意图识别任务细化为战术层级和宏观层级,对不同意图类型分别进行了阐释和形式化描述,并分别研究了相应的识别算法,最后对不同类别的意图进行了识别实验。对于战术层级的机动意图,针对经典HMM模型在
四足机器人相对于双足或者其他多足机器人在稳定性、负重能力和运动速度等方面具有综合性的优势。运动性能一直是四足机器人研究的重要方面。而由于触地时间短、模型强非线性以及欠驱动等特点,四足机器人的高速运动成为提高其运动性能的重点和难点。采用传统控制方法解决四足仿生机器人的运动控制问题时,理论推导复杂,当存在模型失配、畸变、干扰等因素引起的不确定性时,控制效果的改善则变得非常困难。近几年来,基于简单模型的
景象匹配辅助导航由于导航精度高、抗干扰能力强和保障难度小等特点而广泛应用于飞行器的自主导航。景象区域适配性分析是影响景象匹配辅助导航系统性能的重要因素,对该技术进行研究具有很高的工程应用价值。本文针对景象区域适配性相关问题展开了研究。首先,结合辅助导航应用实际情况,对景象区域适配性问题进行了综合分析。一方面对景象区域适配性基本指标——匹配概率进行了研究,并结合景象适配性分析任务中缺少对应图像对的情
卷积神经网络是深度学习算法的重要实现方式之一,在图像识别、视频处理等领域具有广阔的应用前景。然而,随着需求的不断扩展,卷积网络中的神经突触和神经元的数量成倍增加,其带来的硬件功耗、矩阵乘法运算的计算开销均是巨大的。忆阻器具有功耗低、体积小、读写速度快等优点,并且可以快速执行乘累加运算,在硬件实现卷积神经网络上有得天独厚的优势。因此,本文围绕基于忆阻器的卷积神经网络架构展开研究,论文主要工作如下:第