深度学习在低光图像增强问题中的若干应用

来源 :深圳大学 | 被引量 : 0次 | 上传用户:and113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学的发展,数字图像和视频成为人类获取外界信息的主要来源,而在现实世界的夜晚或者其他低光条件下,我们获得的图像和视频质量会降低,这包括亮度低、对比度低、噪声大等特点.这些图像和视频质量的降低将会直接影响到监控安防、夜间行车和生物医学等领域的发展.因此,随着计算机视觉等研究领域的不断深入,图像处理技术备受重视,其中低光图像增强就是计算机视觉的一项重要课题.对于一些经典的低光图像增强算法,参数对算法的影响巨大,找到合适的参数来优化图像成为低光图像增强的关键.近年来深度学习技术不断发展,利用卷积神经网络来增强图像成为研究的热点.基于深度学习的低光图像和视频的增强减少了传统方法中参数对算法的影响.我们发现在RGB空间上对图像进行增强处理容易造成颜色失真现象,在对视频增强的处理上同样会产生这个问题,并且目前的视频增强方法忽略了时间一致性,导致增强后的视频出现闪烁的现象.因此,本文拟对以上缺陷提出了解决方案,针对低光图像和视频增强进行了深入研究.本文的主要研究工作包括:1.针对低光图像和视频增强中出现的颜色失真问题,提出采用将原始处理RGB图像换为处理HSI图像,在H(色调)、S(饱和度)、I(亮度)三个通道中,颜色信息主要保存在H和S两个通道中,进而在HSI颜色空间中(主要在I通道中)做到增亮处理,很好的保护了图像的颜色信息.本文的算法很好的解决了图像和视频增强后的颜色失真问题,在主观和客观两个方面均优于MSR算法和HE算法.2.假设低光视频中的任意两帧图像在时间和空间上具有一定的联系,针对低光视频中由于时间不一致性造成的视频闪烁现象,我们提出了一种孪生残差神经网络.该网络以深度残差神经网络为基础,不仅很好的解决了由于网络深度引起的梯度退化问题,还在深度残差神经网络的基础上增加了一个输入通道.在本文中我们的孪生残差网络很好的学习到了视频任意两帧图片之间的时空联系,让输出的视频具有时间一致性,解决了视频闪烁的问题.同时我们的网络多达152层能够很好的学习了图片特征,并且网络中的残差单元很好的解决了梯度退化问题.3.本文提出了一种基于分解通道的重建损失函数,该重建损失函数很好的权衡了各个通道对图像增强的影响,通过重建损失函数来控制增强后图像的三个通道与目标图像之间的联系,在视频增强算法中还增加了一个自相关损失,来保证输出的两帧图片之间的时空相关性.解决了输出视频闪烁的问题.
其他文献
溴酸盐是含溴化物的水在进行臭氧消毒过程中形成的副产物,国际癌症研究机构(IARC)将其列为潜在的致癌物。溴酸盐的去除方法包括物理法、化学法和生物法。其中生物法通过微生物自身代谢作用在以有机物等作为电子供体条件下将溴酸盐还原为无毒的溴离子。该方法具有低能耗、无二次污染等优点,应用前景广阔。然而,在微生物还原溴酸盐的研究中,溴酸盐还原功能菌群的多样性尚不明确,溴酸盐还原功能基因和代谢机理尚未明晰,溴酸
目前全球大约有2.85亿视力障碍人士,他们因失去视觉这一重要信息源而渐渐被社会边缘化。通过将视觉图像处理技术应用到盲人辅助系统中帮助他们更好地从周围环境获取信息,具有较大的工程意义和社会意义。随着深度学习的发展,以卷积神经网络为基础的目标检测算法开始应用到盲人视觉辅助系统中,其在识别率和鲁棒性上都优于传统图像处理技术。然而,因为卷积神经网络运算中包含大量乘加计算与频繁的数据读写,导致算法移植到资源
蛋白的氧化还原是普遍存在于生物体内的一种化学反应,可由物理、化学和生物因素诱导产生。生理水平的活性氧簇(Reactive oxygen species,ROS)对细胞增殖和生长有积极的调节作用,但如果超过某一阈值,将会严重损害DNA、蛋白质、脂质等生物大分子,造成细胞功能丧失甚至不可逆损伤。含硫氨基酸甲硫氨酸(Methionine,Met)是最易被氧化的氨基酸之一,氧化后的甲硫氨酸形成两种差向异构
既有研究表明保障性住区存在特定人群特征与居住需求,其户外公共空间存在供给与需求不匹配的问题,包括户外空间景观化、功能与设施配给不足、人均活动场地面积偏小等问题。这些问题一定程度上影响了居民的居民生活质量和居住满意度。本研究以保障性住区内的户外公共空间为研究对象,聚焦于居民时空间行为与户外空间关系,围绕着如何提升保障性住区户外空间供给与需求的问题展开。研究在对深圳保障性住房项目进行普查式调研的基础上
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查
对话系统是自然语言处理领域一个重要的研究课题。越来越多的服务商使用智能对话系统来帮助他们减少人工开销。同时,也有越来越多的用户愿意使用智能对话助理来帮助他们完成日常的各项工作。特别是近年来,随着深度学习等技术的发展,面向开放域的对话系统逐渐成为了研究热点。为了设计更好的对话系统,对系统生成的应答进行质量评估,是研究过程中不可或缺的一步。一个好的评估方法,将有助于缩小机器对话与人类之间的差距。然而,
随着万物互联时代的来临,不同于云计算时代,大量数据在网络边缘产生,有限的网络接入带宽和应用对实时性的要求使得远端的云计算中心不能对海量数据进行高效处理。多址边缘计算(Multi-access Edge Computing,MEC)技术作为云计算模式在边缘网络中的扩展,能够在边缘网络中支持资源密集、延迟敏感型应用,并为用户提供有地理位置感知的实时服务。但与此同时,新型信息服务和面向业务类应用的快速增
在现实生活中,人们常常需要对自己拍摄的照片进行各种操作,以实现期望的视觉效果。例如给照片中的人物化妆,改变图像中的呈现的时间或季节,按照某种特定艺术风格对图像进行渲染等等。这通常需要借助相应的图像编辑工具,例如Photo Shop等,并花费大量的时间和精力才能实现上述效果。图像风格转换技术可自动地实现上述图像编辑任务,降低图像编辑的操作难度,提升易用性。给定一张内容图像作为输入和一张图像作为风格参
深度学习是机器学习领域中的一个研究方向,是一种以复杂神经网络为基础架构,学习数据的内在规律和表示特征的算法。深度学习使计算机具有像人一样的分析学习能力——能够识别文字图像声音和挖掘数据内部特征,因此,深度学习已被广泛应用于搜索技术,数据挖掘,自然语言处理,图像识别,机器人导航,推荐系统和个性化技术中,同时也在其他相关领域中取得了许多成果。然而,现有的深度学习模型在计算上昂贵且占用大量内存,从而阻碍
近年来,随着现代信息技术的飞速发展,人类进入信息社会,越来越多现实应用领域涉及到多标签学习问题,如文本分类、生物信息学、图像识别等等。传统的单标签学习中,学习对象只隶属于单一类别,而多标签学习中,学习对象可同时隶属于多个类别,并且类别(标签)之间存在着复杂的关联性。多标签学习的目的是准确预测未知样本具有的标签子集,由于标签数量可能巨大且互相之间存在着复杂的关联性,因此,比传统的单标签学习具有更高的