【摘 要】
:
现今社会处于数据爆炸的时代,其中,图像数据更是数量惊人。为了对图像数据进行分析并获得进一步理解,图像分割是不可或缺的一步。正因为其重要性,大量新的图像分割算法层出叠现。图像分割的目的是把图像中与现实世界相关的物体(即目标)分割出来。然而,由于图像分辨率的扩大、图像包含的内容越来越丰富,人们对图像分割算法的性能和有效性提出了更高的要求。现实世界中的很多图像可能是纷繁复杂的,全自动图像分割算法的结果经
论文部分内容阅读
现今社会处于数据爆炸的时代,其中,图像数据更是数量惊人。为了对图像数据进行分析并获得进一步理解,图像分割是不可或缺的一步。正因为其重要性,大量新的图像分割算法层出叠现。图像分割的目的是把图像中与现实世界相关的物体(即目标)分割出来。然而,由于图像分辨率的扩大、图像包含的内容越来越丰富,人们对图像分割算法的性能和有效性提出了更高的要求。现实世界中的很多图像可能是纷繁复杂的,全自动图像分割算法的结果经常无法反映出用户领会的图像中的物体,因此,通过用户干预——指定某些像素属于目标、某些像素属于背景,融入对图像内容高层的理解的交互式图像分割成了更好的选择。虽然目前出现了很多基于深度学习的语义分割算法,但这些方法大多需要大量的特定尺寸大小的分割结果样本、高性能的硬件资源作为其进行学习的前提条件,它们还需要精巧地设计神经网络的架构并进行相关训练和调优,才能实现精度并不太高的分割。本文关注的是不依赖于特定数据集的交互式图像分割算法,它无需事先分割好的真值图像(仅作为评估分割精度的参照),却能够根据人的主观感受将目标精准、高效地分割出来。通过本文的算法得到的分割结果,可直接用于医疗诊断、目标识别或跟踪等工作,也可直接作为进行深度学习语义分割所需的样本标记数据。本文提出了用于交互式图像分割的表观分离模型,并研究了该模型分别应用于稠密条件随机场(Dense CRF)框架和图割(Graph-Cut)框架的图像分割算法,进而发现并解决了基于这两个框架的传统算法(DenseCut算法和OneCut算法)存在的问题,本人所提出的算法无需多次迭代优化过程,从而实现了高效、准确的前景-背景分割。主要创新点包括:1.提出了一种新颖的用于交互式图像分割的表观分离模型。该模型通过结合图像前景-背景的颜色特征差异和对应的测地线距离差异信息,减少甚至消除了来自背景的杂乱干扰,获得良好的初始软分割结果,为实现最终准确的分割迈出了一大步。现实世界中存在大量前景-背景杂乱或者表观相似的图像,加之受到光线、纹理、模糊等条件的干扰,普通的图像分割算法几乎无法获得令人满意的分割结果。本文提出的表观分离模型充分利用了颜色信息、边信息,借助用户提供的空间位置信息,加入了人类高层的图像理解,实现前景-背景表观分离,使得对这样复杂的图像得以较准确的分割。2.提出结合表观分离模型与Dense CRF框架的精准图像分割算法。基于Dense CRF框架的经典算法,如DenseCut算法,存在多达7个需人为指定数值的参数,这或者需要复杂的参数学习,或者需要耗时的信息统计,且都依赖于特定的数据集。此外,它们可能需要多次均值场推断进行迭代优化才能获得满意的分割结果。且对于表观杂乱或者前景与背景颜色特征相似程度较高的图像,涂鸦交互方式的DenseCut往往需要大量的用户交互工作量。本文算法可根据待分割图像的特性,对每个图像自适应地设置并微调Dense CRF框架中的相关参数,将所提出的表观分离模型应用于该框架,经过一次均值场推断即可获得较准确的分割结果,且降低了用户涂鸦交互工作量。在三个著名的数据集上进行分割实验表明,加入本文提出的表观分离模型后的DenseCut改进算法,在分割精度上优于、在分割时间上接近或者小于近几年的五个交互式分割算法。3.提出结合表观分离、表观交叠惩罚与Graph-Cut框架的快速图像分割算法。基于表观交叠的一次图割(OneCut)算法规避了经典GrabCut算法需多次迭代图割的弊端,大大提高了分割效率。然而经过大量实验可发现OneCut算法容易出现大量孤立点的问题,且孤立点数目在一定条件下与表观交叠惩罚项的权重成正相关。将本文提出的表观分离模型和表观交叠信息合理融入到高效的图割框架中,提出合理的表观交叠惩罚权重方案,缓解了OneCut算法倾向于出现孤立点的问题,提高了其分割精度、降低了用户的涂鸦交互工作量。在三个国际公认的数据集上的分割实验,展示了本文的方法对OneCut算法的改进,同时与其他三个最新的交互式图像分割算法在效率和精度上进行了比较,本文算法实现了它们中的最高精度,且算法高效、可行。
其他文献
内隐多效性选择是指相同的目标可以带来多种效果,能同时满足意识的到的需要和未意识到的需要。个体的外显目标和内隐的目标会被同时激活,在其选择过程中,特定的目标结构会影响着这一激活过程。本研究在总结前人研究的基础上,采用行为学和事件相关电位技术,通过六个实验考察内隐多效性选择及其神经机制,情绪对内隐多效性选择的影响,注意资源对对内隐多效性选择的影响。研究一采用两个实验考察内隐多效性选择及其神经机制。实验
图的交叉数是图的一个经典的拓扑不变量,形象地说,它是衡量一个图离平面图有多远的一个重要参数.图的交叉数问题起源于上世纪五十年代初匈牙利数学家Turan在砖厂中碰到的一个实际难题(Turan’s brick factory problem).因此,图的交叉数概念被提出,随后引发图论学者对这一参数的广泛研究,使之成为图论领域中的一个活跃的研究方向.对图的交叉数问题的研究不仅具有深刻理论意义,而且还有广
斑络新妇蛛是在分布于中国,日本,越南等地的一种有毒蜘蛛。它的毒液由许多具有不同生物活性物质组成。为了更好地开发利用该生物资源,阐明斑络新妇蛛毒素分子多样性及其遗传进化机制是非常重要的。我们取斑络新妇蛛的毒腺建立cDNA文库,随机挑取单克隆进行测序,共得到高质量的EST总数为1380条,有效序列最短为127 bp,最长为1089 bp,平均长度为578 bp。1380个EST序列经归类后得到601个
基于手征夸克模型,本文从散射和重子的衰变过程两方面入手,对重子的性质进行了研究。在散射方面,我们研究了介子驱动的πN → πN过程以及逆光产生过程Kp→γ∧、γ∑0。在衰变性质方面,基于LHCb的最新观测到的五个新的Ωc共振态和三个含底夸克的重子Ξb(6227)-和∑b(6097)±,我们对单重味重子的性质进行了较为系统的研究。主要研究结果如下:一、通过研究πN→ πN散射过程,我们发现:(1)在
分形几何作为当今世界十分活跃的理论,它的出现,使人们用新的角度来描述这个世界.随着学科交叉和融合,分形几何与数学的各主要分支建立了密切的联系.例如:在分形几何与调和分析交叉研究方面,Jorgensen和Pederson[45]首次发现了奇异非原子测度(四分Cantor测度μ1/4)是谱测度.这一发现开创了分形几何与Fourier分析相交叉的全新的研究方向(分形上的Fourier分析),该方向迅速成
本文主要研究Euler-Poisson方程组解的整体适定性及长时间行为.作为一个重要的流体动力学模型,Euler-Poisson方程组获得了越来越多来自数学、物理以及生物界的关注,它描述的物理流包括半导体装置的电子和空穴的传输、等离子体中阳离子和阴离子的传输、气态星体内部粒子的流动以及生物学中通道蛋白的粒子运输等等.本文,我们讨论了如下Euler-Poisson方程组其中Ω是RN,(N=1,2,3
相对论量子信息是量子信息理论、量子场论、相对论、量子光学等诸多学科交叉的前沿研究领域,它极大地丰富和完善了量子信息理论,也能帮助人们深入地理解和研究相对论和其它引力理论。一方面,我们可以在相对论框架下探讨对量子资源进行信息编码、传输和处理等量子信息处理任务;另一方面,我们还可以利用量子信息测量手段进行高精度测量,从而探测时空的性质、相对论效应以及相关的物理量,为实验验证开辟新的道路。毫无疑问,弄清
基于广义相对论和宇宙学原理建立的现代宇宙学虽然取得了辉煌的成就,但还有一些亟待解决的重大理论问题,其中之一就是宇宙目前为什么在做加速膨胀。一种解释宇宙目前加速膨胀的方式是引入暗能量,它是一种具有负压强的能量组分。大量的观测数据表明,暗能量如果存在其大约占据宇宙能量的70%。另一种方式就是对爱因斯坦引力理论进行修正,通过这种方式我们不需要直接引入暗能量就可以解释宇宙目前的加速膨胀。基于绝对平行引力理
随着全息原理的提出以及AdS/CFT对偶的实现和应用,人们在爱因斯坦-麦克斯韦理论下通过考虑耦合的复标量场发现了黑洞的在低温时存在而高温时消失的标量毛。这类带毛黑洞的求解主要是用数值方法,从视界处积分到无穷远。其中标量毛出现的关键是根据AdS/CFT对偶,让标量算符的源为零。标量毛在低温时存在而高温时不存在的特点,是通过引入标度变换以达到在固定电荷密度下带电标量场期望值随温度变化而实现的。一方面,
图像分割是计算机视觉中一个基本而核心的问题。是目标识别、目标跟踪、智能交通和医学图像处理等领域的基础。虽然近年来有关图像分割的研究成果越来越多,但由于图像分割本身所具有的难度,仍然存在众多问题,因此,图像分割仍然是计算机视觉中重要的理论问题,同时有很强的应用背景。基于图论优化的图像分割技术由于其良好的分割特性,近十年成为国际上图像分割领域的一个新的研究热点。主要特点有:图像特性与图论特性之间存在良