基于深度学习的CFA图像复原方法及硬件加速技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gxblackjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
彩色图像通常是采用覆盖有色彩滤波阵列(Color Filter Array,CFA)的CCD/CMOS传感器完成采集,通过这种空间采样方式采集到的CFA图像不仅缺少完整的颜色信息,而且还夹杂着传感器测量噪声,从而严重影响人类视觉系统从上述CFA图像中获取有效信息。因此,需进行包含图像去噪和图像去马赛克的CFA图像复原处理,将其还原成反映真实场景纹理和色彩的RGB图像才能有效的应用于国防安全、AIo T和安防监控等重要领域。然而现有传统方法在CFA图像复原过程中难以保持场景细节信息而且易于引入伪色,新兴的深度学习方法虽复原性能更好,但因参数量和计算量巨大,难以满足硬件部署时严苛的功耗和延时要求。鉴于此,本文深入研究了性能更高的轻量化CFA图像复原神经网络模型并设计了与之适配的硬件加速系统。本文结合单CCD/CMOS传感器的成像原理,在分析CFA图像产生机理的基础上,建立了CFA图像复原模型,并提出了结合分组自膨胀卷积的轻量化联合去噪全马赛克网络模型JDD-GADCNN。由于所提出的分组自膨胀卷积可根据场景自适应调整卷积的空间采样位置,其特征表达能力更强,得益于此,JDD-GADCNN模型能够更为精准的抑制噪声并还原出真实色彩的RGB图像。基于合成噪声和真实噪声的CFA图像复原实验结果表明,相比于传统CFA图像复原方法,本文方法复原的图像质量得到显著提升,而相比于经典深度学习CFA图像复原方法,本文方法在保持同等复原质量下,大幅降低了模型的参数量和计算量。为了在嵌入式移动硬件平台上高效部署JDD-GADCNN模型,本文还对算法模型进行了混合精度量化调控,在保证模型性能的前提下进一步降低了卷积的计算复杂度和存储需求。本文针对混合精度量化后的网络模型,设计了高性能、低功耗且可实现灵活配置的硬件加速系统。首先,提出了基于GEMM的统一四核Conv Engine单元,通过基于DRU的分组自膨胀卷积控制逻辑和Pointwise卷积控制逻辑对四核Conv Engine单元进行控制即可分时复用四核Conv Engine单元,以实现多种大小卷积核的标准卷积、自膨胀卷积、分组卷积以及Pointwise卷积的计算。其次,在四核Conv Engine单元流水线后方设计了Float Core对卷积结果进行带宽转换并完成Qtz-BN的浮点数据计算。此外,本文还设计了硬件加速系统的任务专用指令集,并基于此,设计了主从控制逻辑单元,通过控制数据调度并配置和调用上述电路单元组成的单层运算单元,以实现完整的网络模型计算。最后,基于FPGA的原型验证实验结果证实,所设计的硬件加速系统正确的运行了JDD-GADCNN模型并获得了更高的计算效率,处理FHD图像的帧频可达到29.5 FPS,满足了实时处理要求,帧率能效比达到了Nvidia GTX1080Ti GPU的29.94倍。不仅如此,本文设计的硬件加速系统的吞吐率达到了978 GOPs,能效比是现有的硬件加速器的3.5倍以上。本文的研究成果可进一步设计为专用集成电路并部署于CCD/CMOS传感器后端代替传统的图像去噪和图像去马赛克电路,使其获得更高质量的图像。
其他文献
近年来,随着大众对数字媒体的版权意识显著提高,各种基于水印的版权保护技术得到了不断发展。其中,基于调幅加网的水印隐藏技术,具有低成本、易实施等特点,不仅适用于数字图像,亦能用于印刷图像。但是,这项技术也存在两个关键问题,首先,传统方法在添加水印后会出现明显水印轮廓痕迹,从视觉效果上破环了原稿图像;其次,水印的检测方式过于单一,而且无法清晰地提取出完整水印。本文通过研究调幅加网技术以及网点特性,在实
学位
图像的清晰度决定了成像系统可以呈现的细节量,它是影响图像质量最为重要的因素。无参考(No reference,NR)图像清晰度评估是无参考图像质量评估的重要组成部分,目前人们已经提出了许多客观无参考清晰度评价算法,这些算法基于人类视觉系统(Human vision system,HVS)展开,但很少涉及针对浅景深图像清晰度进行评估的内容。浅景深图像是一类通过突出视图中的主要拍摄对象使主体对象更加生
学位
工业生产品的质量检测是自动化生产中的一个必要环节,通过计算机视觉技术自动地进行产品质量检测可以极大降低人力成本,提高生产效率。越来越精细的工业产品,对质量检测技术提出了诸多要求,相关技术的发展也遇到了各种挑战。在各种可能的技术方法中,本文认为三维点云的细节差异分析,将成为一种有效的三维物体质量检测方法。现有的基于三维点云特征提取的方法大多用于三维物体识别、模型分类、三维重建等场景,能直接应用于细节
学位
国际旅游者作为消费者的一种,属于国际私法中的“弱者”。国际旅游纠纷的解决应当采取费用低廉、方便快捷、实质有效的方式。目前存在的国际旅游纠纷解决机制包括诉讼、仲裁、调解、和解以及各国自行建立的旅游投诉制度。旅游投诉制度在解决国际旅游纠纷的过程中具有成本优势、程序优势及资源与专业优势,但由于缺乏有效的全球合作机制,各国的国际旅游投诉机制的运行仍然因国别、语言的障碍而难以有效发挥作用。海牙国际私法会议的
学位
一国法院在审理涉及国家豁免的诉讼案件时,可能会遇到本国外交部门或其他行政部门在诉讼的不同阶段介入案件审理的情形,这会影响到法院对外国国家豁免待遇的判断。本文采用历史和实证的研究方法,梳理了部分有关外交介入国家豁免诉讼的立法和司法实践,对国家豁免诉讼中的外交介入问题进行了综合研究。本文除引言与结论外,共分为四章:第一章对国家豁免问题的历史发展进行简单梳理,探讨了国家豁免权在绝对豁免与限制豁免两种不同
学位
世界贸易组织(WTO)的成立是为了实现多种目标,而这些目标都是为了确保成员国之间自由贸易的顺利进行。现有文献表明,贸易自由化可以通过各种途径减少一个国家的失业率。因而加入WTO将帮助各国从自由贸易中受益,从而导致失业率下降。为了检验这一点,本文采用双重差分(DID)计量分析方法,考察了在1991年至2017年期间,加入WTO对175个国家失业率的影响。实证结果显示,加入WTO将使得一个国家的失业率
学位
基于人工智能的计算机视觉技术已在众多领域中广泛应用。近年来随着卷积神经网络的兴起,其在如目标检测与目标跟踪等计算机视觉任务中获得了远超传统算法的精度和性能。然而,由于卷积神经网络巨大的计算量与海量的参数对硬件部署平台的算力与存储资源都提出了极高的要求,给深度学习算法在实际应用场景中的嵌入式或移动平台部署带来巨大的功耗、延时等性能挑战。鉴于此,本文深入研究了轻量化的目标检测与目标跟踪算法及其硬件加速
学位
目前,我们国家正处于信息化大发展大建设的关键时期。图像作为人们在日常生活中使用最多的信息媒介,在信息处理的研究领域中占据着极为重要的地位。关于图像中包含位置信息码点的提取与过滤是近几年的一个新兴问题,如何快速、实时、准确地完成码点信息的提取是当前的研究热点。图像解码技术目前在很多领域都有着广泛的应用,如元宇宙中人体动作的关联。为了满足图像解码系统对快速、实时、准确特性的要求,本论文提出了一种基于F
学位
模数转换器在信号处理系统中占据重要地位,直接射频采样概念的提出,使模数转换器朝向GS/s级高带宽方向发展。现代工艺下,电源电压幅值减小,输入信号电压摆幅缩小等劣势逐渐明显,打包电路对于时间边沿分辨率已经超过对电压的分辨率,电压域模数转换器从电压域转换到时间域是未来发展的一种研究趋势。时间域模数转换器因其独特的信息传输方式,能够克服电压域电压幅值减小,输入信号电压摆幅缩小等劣势,同时能够享受摩尔定律
学位
随着科学技术的发展,人们对于地球外空间的探索逐步深入,半导体器件长期运行在强辐照环境中,器件的可靠性减弱。β-Ga2O3材料的禁带宽度高达4.9 eV,强键合力使得其天然的具有优秀的抗辐照能力,适合应用于航天系统中。重离子广泛存在于空间辐照环境中,不同能量与剂量的重离子辐照β-Ga2O3基SBD会产生不同类型的损伤,引起器件性能退化甚至失效。因此,本文开展β-Ga2O3基肖特基二极管的重离子辐照研
学位