色调敏感的图像视频内容理解与编辑

来源 :武汉大学 | 被引量 : 0次 | 上传用户:leoling819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于包含信息量丰富,且直观易懂,图像视频在数字传媒、智能系统、社交娱乐、网络直播、监控安防和军事侦查等多个领域都有重要应用。上述应用通常以对图像视频内容进行准确理解和可靠编辑为前提,而人类视觉感知系统对色调高度敏感,因此以色调为线索或载体进行图像视频内容理解和编辑受到了大量的关注,现已发展成为计算机图形学、计算机视觉和图像视频处理领域的一个热点研究问题。色调敏感的图像视频内容理解与编辑以色调信息为切入点,通过构建模型或基于相关理论,对图像视频中的内容进行可靠的分析、识别、理解和编辑,以生成满足实际应用需求的结果为目的。本文对该课题所涉及的理论、方法、关键技术以及应用上展开深入、系统的研究,围绕航空图像云检测、欠曝光视频增强以及图像重着色三个方面开展图像视频内容理解与编辑研究工作。具体地,本文首先对航空图像进行色调驱动的内容理解,探讨了航空图像云检测这一研究问题。接下来,重点研究了以色调编辑为主体的欠曝光视频增强和图像重着色。对图像视频进行快速、可靠的内容理解和编辑是涉及诸多困难和挑战的研究课题。对内容的理解要求准确区分场景中不同对象,并能推断出该对象是何物体、位于何处,其中牵涉到场景语义分析、目标识别和图像分割等多个问题。尽管上述问题对应的研究领域取得了长足的进步,但对于特定对象的全自动、高效率、高精度理解仍然是有待解决的问题。对于内容编辑的研究工作已经有很多,涉及颜色、光照、对比度、风格和时空位置等多个方面,但普遍存在效率低、可用性差和视觉感知不友好等问题。认识到人类视觉感知系统对于色调的高度敏感性,本文以色调为线索,多角度研究了图像视频内容的理解和编辑问题,为包括航空图像云检测、欠曝光视频增强和图像重着色三个领域的研究提供了行之有效的解决方案。本文首先从云区和非云区之间的色调差异性出发,深入研究了高分辨率RGB彩色航空图像云检测问题。接下来,对低照度环境下色调的恢复问题进行了分析和思考,探讨了欠曝光视频增强问题。最后,本文研究基于简易颜色面板如何对图像进行快捷有效的重着色。具体地,本文主要研究内容包括如下几个方面:(1)提出了基于累进式优化的RGB彩色航空图像云检测方法。方法以航空图像云区色调和纹理的统计观察特性为基础,构建了一种由粗到精、逐步细化的累进式云检测框架,有效区分了云区和非云区地物,获得了高精度云检测结果。另外,本方法首次引入了局部线性模型,用于检测航空图像中的半透明云区。(2)提出了基于感知驱动融合的欠曝光视频增强方法,达到了对欠曝光视频进行虚拟光照补偿,进而提升场景能见度、细节辨识度和颜色饱和度的目的。其中,本方法首次引人类视觉感知度量用于评估视频质量,引导算法生成全局最佳虚拟曝光的视频结果。另外,提出了感知驱动递进式融合框架,用于无缝融合所有局部最佳曝光的区域。最后,为消除视频中存在的噪声干扰,且保留清晰的纹理结构,提出了保纹理自适应时空滤波器。(3)提出了基于颜色分解优化的面板驱动图像重着色算法,显著简化了图像重着色这一常见图像编辑操作,同时保证了生成的结果符合人类视觉认知,具备逼真的颜色和自然的外观。为快速生成颜色面板描述图像中的主要颜色分布,本方法首先提出了一种与图像大小无关的高效面板提取算法。之后,构建了颜色分解优化模型,揭示了颜色面板和图像颜色之间的本质联系。最后,介绍了一种图像重着色算法评估思路,并首次公布了图像重着色测试图片集用于算法评估和对比。围绕着图像视频内容理解和编辑这一主题,本文多角度、全方位地对色调相关的问题进行了深入系统的研究,对其中涉及的关键技术难点提供了详细的解决思路和方法。实验结果表明,本文提出的算法在各自领域都优于已有的方法,且可以被推广到多种图像视频相关的应用场景。
其他文献
为了促进相邻沿海国家间关系的稳定与和平,《海洋法公约》禁止任何一方在争议海域内的单边行动,而是在相互合作的基础上提供了一个新的理论,进而更好地管理和利用海洋及其自然资源。《海洋法公约》使得缔约国能够以签署共同开发协定的方式为勘探和开发油气资源开展合作。这一规定有助于在解决自然资源的归属问题上缓解两国的紧张关系。此外,它还要求相关国家搁置海域划界争端而聚焦自然资源的共同管理。虽然非洲国家之间存在许多
现代密码技术是保障信息系统安全的基础,而作为密码算法运行载体的密码设备正受到多种侧信道分析攻击的威胁。目前学术界和工业界都已普遍接受侧信道分析方法对密码设备构成的严重威胁,并对侧信道防护方法进行了广泛的研究。目前的侧信道防护方法可以分为隐藏技术和掩码技术两类,其中算法级掩码防护方案是尤其受到关注的防护方法。在现有大量的掩码方案研究中,基于秘密共享的多种高阶掩码方案实现了在任意给定阶数下的可证明安全
根据摩尔定律,当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。现如今,半导体器件的特征尺寸从微米级缩减至7纳米,逐渐接近摩尔定律的极限。深纳米尺寸的电子器件面临众多复杂且难以解决的量子效应,给半导体行业带来前所未有的挑战。与此同时,人工智能飞速发展,由谷歌(Google)旗下DeepMind公司开发的人工智能机器人AlphaGo吸引人们对深度学习的
近年来,随着科技的迅猛发展,智能手机、电脑、可穿戴设备、智能家居设备和无人机等电子产品已被广泛使用并将逐步普及,这给人们的生活带来了极大的便利。然而,这些产品续航能力不足的问题也渐渐的凸显出来。可见,以低功耗设计为优化目标的产品是当今绿色智能电子设备发展的必由之路。智能电子设备中最重要的组成部分是处理器和存储器,这两部分通常也是功耗开销的主要部分。随着半导体工艺的进步,处理器的运行速度越来越快,而
软硬件划分是软硬件协同设计中关键步骤之一,随着嵌入式系统任务复杂度和设计规模的增加,已逐步成为一个具有挑战性的优化问题。粒子群算法因其概念简单、实现容易和收敛速度快,已被广泛应用于软硬件划分问题中。但是没有一种通用的算法能够有效地解决所有类型的软硬件划分问题,采用粒子群算法求解软硬件划分存在如下问题:1)早熟收敛;2)容易陷入局部最优解;3)时间开销高。为了解决粒子群算法求解软硬件划分中的问题,本
对于软件开发和维护人员来说,软件调试是日常性的工作。一般而言,软件调试过程包括错误定位、错误理解和错误更正。不幸的是,软件调试极其费时、费力,实证研究证实软件调试的开销己经超过软件开发费用的50%。为了应对这一挑战,人们提出软件调试的自动化处理,并且对其展开了广泛而深入的研究。但是,由于软件本身的复杂性,软件演化等原因,目前的自动化软件调试方法存在一些问题,如调试结果的质量不高,调试方法的适用性不
计算机视觉领域的研究涉及众多的学科,而运动目标的跟踪技术是其中重要的研究方向之一。近年来,随着计算机图像处理、模式识别、人工智能以及相关学科研究的不断深入,目标跟踪技术也得到了长足的进步。目前在这一领域的研究主要集中在两个大的方向上,其一是基于先验知识的目标跟踪技术研究,在获得初始的目标运动信息的基础上进行目标的跟踪;其二是不依赖于先验知识的目标跟踪技术研究,通过在视频中识别并检测出感兴趣的目标完
接触式图像传感器于20世纪80年代末面世,1998年首次应用于扫描仪,21世纪初开始广泛应用于金融机具中,例如点钞机、清分机、ATM机等,目前仍处于发展阶段。在金融机具应用背景下,接触式图像传感器的图像存在分辨率丢失、三色分离及噪声问题,对于这些问题的研究,目前仍处于起步阶段。本文将金融机具应用背景下的接触式图像传感器的彩色图像作为主要研究对象,旨在采用软件算法的方式解决其分辨率丢失问题、三色分离
云计算和大数据时代,数据比算法更能深刻的影响计算结果。根据需求度量价值的原则,以按需服务的视角来理解价值,那么价值即服务,即VaaS(Value as a Service)。从数据中发现价值信息并为用户所用,就可以理解成从数据中按需进行价值服务发现的问题。面对互联网上的各种数据资源,如何从中获取知识以支撑价值服务的发现成为亟待解决的一个重要问题。数据规模的剧增以及数据本身结构的复杂性,增加了价值服
SaaS软件所处环境的开放性和动态性导致其在长时间运行过程中可能出现性能降级问题,根据动态变化的环境快速优化SaaS软件的部署方案是应对该问题的一种有效途径。然而,SaaS软件的服务化特点及其运行平台的硬件虚拟化特点使得传统的部署优化方法无法直接用于解决SaaS软件的部署优化问题。为此,本文针对SaaS软件的部署特点,提出了一种能够在运行时自动为SaaS软件寻找性能最优部署方案的方法,具体内容如下