【摘 要】
:
图像分割是图像处理技术中的重要内容,在数字图像技术快速发展和日益普及的今天具有非常重要的意义和作用。交互式图像分割指提取用户的交互信息,结合图像包含的特征,对图像中用户感兴趣的目标和区域进行提取的一种技术,是图像分割技术的延伸和拓展,具有广阔的应用前景。分割结果的好坏和执行效率对于后续图像处理的质量具有决定性的影响。交互式图像分割技术经历了长期发展,积累了众多理论和方法。本文对这些方法进行了调研和
论文部分内容阅读
图像分割是图像处理技术中的重要内容,在数字图像技术快速发展和日益普及的今天具有非常重要的意义和作用。交互式图像分割指提取用户的交互信息,结合图像包含的特征,对图像中用户感兴趣的目标和区域进行提取的一种技术,是图像分割技术的延伸和拓展,具有广阔的应用前景。分割结果的好坏和执行效率对于后续图像处理的质量具有决定性的影响。交互式图像分割技术经历了长期发展,积累了众多理论和方法。本文对这些方法进行了调研和分析,提出了一种新型的交互式图像分割模型和方法。该算法使用高分辨率网络作为特征提取模块,结合特征的上下文信息进行特征增强,实现基于图像理解的交互式图像分割。当用户给定的交互点不能在分割结果中被正确划分时,算法使用基于误差反向传播机制的注意力优化机制,通过修改模型中的局部特征实现对分割结果的纠正,提高交互信息的利用效率并优化分割效果。相比于其他机制,注意力优化机制有效地避免了全局范围的误差反向传播计算,缩短了优化机制的运行耗时。我们在多个常用的标准图像数据集上展开测试,并与当前代表性的主流交互式图像分割算法进行了对比实验,结果表明本文所提出的模型和方法在分割效果与计算效率上均有显著的优势。
其他文献
成像设备的抖动,元器件的噪声和图像编解码等都会导致图像退化。图像复原则是处理退化的图像,使其与原始图像更加接近。传统的图像复原方案有很多缺点,如计算时间过长,鲁棒性较差等等。近几年,基于神经网络的复原方法逐渐被提出,这种算法可以充分获取图像的先验知识,有效地提高图像处理速度,因此受到学者的广泛关注。然而现有的算法大多解决的是比较单一的图像降质问题。如在图像去模糊方面,仅解决人为制造的模糊核,而这类
心血管疾病日益成为世界首位死亡原因,治疗心血管疾病的投入很高。在防控心血管疾病上,平时的健康管理是必要的手段。由于防治指南无丰富、可操性的管控知识,但是健康网站上未经处理的管理知识也无法提供最有效的信息、可行性。不同来源的健康知识是否可靠,知识是否有理论依据,如何挖掘出更多的信息和科研方向均需要研究。因此如何将健康知识抽取关键信息、有效分类、挖掘并应用到实际中,是提高知识使用效率、指引科研方向等实
随着深度学习及与其相关的动作识别技术的兴起,电子设备在此过程中逐渐展现出其独特的功能性。目前,这已成为计算机视觉的主流研究方向之一,并且在人机交互领域彰显出巨大的潜力。然而,在实现过程中,可能会遇到与诸如计算代价和效率等相关的各项挑战。同时,人体动作识别又是一个极为复杂的领域,因为图像序列可能会包含一系列不属于特定动作的多样化特征。为了解决上述问题,本研究提出了一种基于DTA技术(Detect、T
飞行员在环数值仿真系统是验证民机功能设计、研究航空人为因素的重要工具。随着民机自动化水平的提高,飞行员与飞机自动化系统之间功能分配设计的合理性是保障飞行安全的重要前提。为保证从仿真模型开发到飞机系统设计的无缝衔接,需围绕飞行员在环仿真系统建立合理的设计流程,并对民机系统设计中的人机功能分配问题建立有效的评价机制。本文的研究内容主要包括:引入基于模型的系统工程方法从而建立飞行员在环数值仿真系统从飞机
随着市场竞争的不断加剧,企业必须根据外部市场的变化,通过提高内部管理水平,加强管理管控,以提升自身的市场竞争力,保证战略目标及经营目标的实现。全面预算管理是实现企业经营目标的重要管控手段和保障之一。作为企业战略规划及经营计划的量化工具,全面预算管理在企业管理中得到广泛应用。但如何有效进行全面预算管理,则是所有企业均需面对的问题。本文将根据全面预算管理在企业经营目标实现中的作用以及大多数企业目前运用
随着技术的发展进步,显示设备的性能逐步提高,除了分辨率和色彩丰富度的提高,也表现在刷新率的显著提高。而电子显示屏显示动态影像的原理与人眼的视觉融合及视觉暂留效应是紧密联系的,当快速变化的静态图像达到一定的变化频率,人眼看到的画面就会产生动态感,这个频率在通常情况下是60Hz左右。目前的高端商业显示器的刷新率已经可以达到144Hz甚至更高,而更高的刷新率除了可以给观看者带来比以往更流畅的观看体验之外
场景的三维重建技术是计算机视觉和定位导航的重要研究课题,使用该技术可以获得物体的3D轮廓,也能获取轮廓上任意点的坐标。随着视觉导航技术的不断发展,人们对使用计算机模拟现实世界的三维场景越来越感兴趣,对三维重建技术的要求越来越高。基于单幅图像的三维重建是三维重建中一个重要的研究方向,重建过程中的主要困难是信息的不充分性,但由于其重建效率高、成本低廉,在虚拟现实、大型场景重建、城市数字化和文物恢复等领
咬肌肥大是指单侧或双侧咬肌的无症状扩大,通常会导致方形的下颌面轮廓,在亚洲人的审美中一般认为这是不美观的。在人们对美的要求普遍越来越高的今天,针对咬肌的A型肉毒杆菌毒素(BoNT-A)注射疗法由于它的低侵入性以及对咬肌肥大良好的治疗效果已经在亚洲得到了广泛的临床应用。然而,如今主流的BoNT-A咬肌注射技术基本是从临床实践中总结而来,尚未有研究基于解剖结构信息对咬肌注射技术进行统计学上可信的定量评
民营航空行业的IT信息化系统相对比较传统。但对于安全性和稳定性的要求非常高以至于航空行业的系统架构变化很小。很多企业仍然沿用着许多年前的技术方案。而当今人们对出行的需求日益旺盛,也更加注重出行效率和出行体验。用户的需求变化快、种类多,这种现状就要求公司要有快速、高效的软件交付能力用以支撑业务的快速发展。目前单体架构模式的系统已经成为了业务持续增长的瓶颈。从提出需求到最终上线往往需要耗费大量的时间,
近年来,随着国家天网工程的建设和人民对公共安全的关心,行人重识别技术被广泛应用在视频监控,智慧安防,刑事侦查等领域。迫切的实际需求使得行人重识别技术发展迅猛,其中基于视频的行人重识别含有更丰富的语义信息和运动信息,逐渐受到更多研究者的关注。在针对表观特征学习的视频行人重识别研究中,将行人序列映射为单一的总体特征是其关键。平均池化或循环神经网络是最经典的聚合所有单帧特征的方法。但是,它们往往很难处理