复杂场景下交互式双边图像和视频目标分割算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:trebleclefj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,图像和视频已成为人们生活中最重要的信息传播载体之一,而图像和视频目标分割技术在图像和视频处理中扮演着重要的角色,且已广泛应用于影视制作、虚拟现实和智能监控等多个领域。交互式的图像和视频目标分割技术根据用户在图像或关键帧的标记作为分割的先验信息以获得分割结果。然而,针对具有复杂场景的图像和视频,现有的分割方法想要获得准确的分割结果,往往需要在前景和背景区域提供大量的用户交互。因此,本文围绕图像和视频目标分割方法的分割质量和分割效率进行分析,对现有方法所存在的局限性和重难点问题进行探讨,并基于双边网格进行预处理及改进图割算法等方面展开研究。针对复杂自然场景下图像分割方法分割质量和效率不高的问题,本文提出一种基于外观模型和高阶一致能量的双边图像分割方法。首先采用双边网格将图像像素点采样至5维的双边空间,其次以非空双边网格单元作为结点并构建图割优化模型,其定义具有置信度判别的外观模型,并引入增强标签一致性的高阶一致能量项。最终采用最大流/最小割算法求解能量函数,从而获得较好的分割结果。实验结果表明,该方法在复杂场景下不仅能够获得高质量的图像分割结果,且对高分辨率的图像分割也具有实时性。相对于图像分割,视频目标分割往往更具挑战性,本文将上述方法扩展至视频中以解决复杂场景下的视频目标分割问题。本文提出一种动态外观模型和高阶能量的双边视频目标分割方法,将视频目标分割转换为基于双边网格单元的马尔可夫随机场模型求解问题。首先将带关键帧标记的视频序列映射至高维的双边网格,极大地减少待处理的数据。然后以非空网格单元作为图的结点并构建图割优化模型,其关键在于定义了具有置信度判别的动态外观模型,并在能量函数中引入鲁棒的高阶能量项。最后利用最大流/最小割算法进行全局优化求解,以为视频像素点分配二值标签,最终获得视频目标分割结果。采用DAVIS2016和SegTrackv2数据的实验结果表明,该方法在提供少量用户交互的情况下,不仅能在处理具有复杂场景的视频时获得理想的视频目标分割结果,而且还能显著提高视频目标分割的时间效率。
其他文献
永磁有刷直流电机被广泛应用于在汽车行业。随着汽车产业的发展,永磁直流电机的需求不断增加。直流永磁有刷电机设计有许多关键参数,其中接触电阻参数和永磁体结构参数分别影响电机的机械性能和电磁性能。接触电阻可以反应电机换向的情况,影响着电刷和换向器的寿命,同时也影响电机的堵转扭矩。但相关的接触电阻测试实验较少,导致许多设计者只能凭经验决定数值。振动是电机电磁性能的一种表现,永磁体的结构影响电机内部的磁路,
在公路交通事业的快速发展过程中,高速公路的地下管涵使用数量日渐增多,而埋地管涵的新形式也不断出现,玻璃钢夹砂管涵就是其中比较具有代表性的一种新型复合材料涵管。玻璃
赭曲霉毒素A(Ochratoxin A,OTA)主要由青霉属(Penicillium)和曲霉属(Aspergillus)真菌产生,是葡萄及其制品中最重要的真菌毒素污染物之一,能够对人和动物的健康产生巨大威胁
随着城市化进程和生活节奏的加快,人们的工作、生活以及学习压力越来越大,由此产生的一系列心理问题成为当代社会发展进程中亟待解决的重要问题。与此同时,人们对美好生活环境的向往也愈发强烈。因此,在有限的城市生活空间中营造优美且具有复愈性效益的环境来调节人们紧张、压抑的状态,缓解各种心理压力,已显得尤为迫切。本研究以复愈性环境理论为指导,结合对国内外相关案例的借鉴分析和对设计场地调研的基础之上,进行了现状
成像光谱仪是一种能同时获取二维图像信息和一维光谱信息的设备,丰富的数据便于对目标进行分类识别,广泛应用于矿物勘探、对地遥感、海洋监测、生物医疗等领域。但成像光谱仪给出的三维数据是一个高维高冗余的数据,在使用中不够直观,需要依赖计算机数据处理来获得分类识别结果。随着成像光谱仪器复杂化和应用要求的提高,成像光谱仪器指标随之提高,大量的信息给数据传输、存储、处理带来了巨大压力。为了解决该问题,本文研究了
土地托管是继土地流转后又一土地经营制度的创新。自2014年起,在国家农发办的大力支持下,启动了土地托管试点工作,经过几年的实践已初见成效,并显示出强大的生命力和广阔前景。昌吉州作为新疆土地托管的创新试点区,对其土地托管现状及运行情况进行研究有着重要的现实意义。目前昌吉州有较好的土地规模化基础,较高的农业综合机械化水平的技术支持,土地托管规模不断扩大,专业合作社、供销合作社已成为土地托管的主要服务主
传统的工程地质资料只能反映地层某一方面或某一方向的信息和变化,如钻孔资料只能反映地层竖向信息的变化,剖面资料只能反映地层横向信息的变化;它们对真三维地质体的表达能力有限,很难分析地质体内部的属性信息和空间变化,难以满足现实需求。随着可视化技术和地质信息模拟技术的发展和应用,三维地质建模得到较快发展,它能够直观的表达三维地质体的属性信息和空间变化。三维地质建模融合了地质学、地理信息科学和计算机等学科
废旧轮胎橡胶沥青因其良好的耐温性、抗疲劳性和抗滑性,道路降噪和低施工成本以及废物回收的环境优势而受到道路建设行业的高度关注。近年来,随着固体物理、量子化学、计算方法等相关学科的发展,以及计算机对于数据处理能力的空前提高,使得使用计算机对材料进行设计已然成为可能。这为我们认识研究物质内部结构以及其性质提供了更强有力的手段。一个科学、合理、可靠的数值模拟模型的确定,不仅可以对橡胶改性沥青的微观行为进行
前人研究发现 BCAS2 基因(Breast cancer amplified sequence 2,BCAS2)参与了小鼠精原干细胞中的可变剪接,该基因的缺失会导致小鼠精原细胞减数分裂启动异常,生育能力丧失。而在公猪睾丸中的功能表达情况尚不清楚。本试验以安徽地方猪圩公猪为材料,采取初情期启动前后睾丸组织,分析BCAS2基因的表达差异,检测BCAS2在睾丸组织中的蛋白表达水平及定位,结合初情期启动
随着社会的不断进步,日益便捷的公共交通大大促进了人口在全国范围内的流动,再加上现代社会人们对教育和儿童健康成长的重视,越来越多的外出务工人员选择将他们的孩子带到繁华的大都市学习和生活,这些跟随父母一起流动的儿童比起在家留守来说,有了更多的陪伴和更好地生活环境,但是也面临着新环境中的各种挑战,根据现有的调查研究显示,大部分流动儿童在社会适应的过程中都存在着一定的问题,这些问题对他们三观的形成和心理的