【摘 要】
:
实例分割是计算机视觉领域中重要且具有挑战性的研究方向之一。相较于语义分割(预测图像中每个像素的语义类别)和目标检测(预测图像中每个物体的类别和位置,位置以边界框的形式给出),实例分割可定义为同时解决上述两种问题的方法,即需要区分相同类别的不同物体,同时对每个物体进行像素级别的分割。因此,实例分割在自动驾驶、安全监控、智能医疗等领域有着广泛的应用。目前,实例分割主要基于深度学习的方法,从而需要大规模
论文部分内容阅读
实例分割是计算机视觉领域中重要且具有挑战性的研究方向之一。相较于语义分割(预测图像中每个像素的语义类别)和目标检测(预测图像中每个物体的类别和位置,位置以边界框的形式给出),实例分割可定义为同时解决上述两种问题的方法,即需要区分相同类别的不同物体,同时对每个物体进行像素级别的分割。因此,实例分割在自动驾驶、安全监控、智能医疗等领域有着广泛的应用。目前,实例分割主要基于深度学习的方法,从而需要大规模的数据集。然而受限于现实中的各种条件,对大量无标签样本进行标注是很困难的,因此研究者们开始关注小样本学习。小样本学习可以从非常少的样本中学习到新的概念,从而减轻深度学习对大量样本的依赖。本文研究小样本实例分割:给予模型一张查询图像和少量支撑图像,模型可以根据支撑图像对查询图像中的同类别的物体进行实例分割。目前,小样本实例分割模型主要基于孪生神经网络,其中有两阶段的Siamese Mask R-CNN、Meta R-CNN和FGN,以及单阶段的YOLACT和FAPIS。为了进一步提高模型性能,本文在先检测后分割的两阶段小样本实例分割和直接进行分割的单阶段小样本实例分割这两个方向上进行研究,主要工作内容如下:1)本文提出了一个两阶段小样本实例分割模型。模型在第一阶段预测出可能存在物体的候选区域,在第二阶段对候选区域中的物体进行进一步的分类、边界框回归以及像素级分割(即对每个像素进行二分类,判断其是否属于该边界框内的物体)。本模型的主干网络为Res Net-50孪生神经网络,即使用共享权重的网络参数分别对查询图像和支撑图像进行特征提取。在第一阶段,本模型使用注意力机制使得RPN(Region Proposal Network)专注于支撑物体,提高预测候选区域的精准度。在第二阶段,利用余弦相似度分类物体的嵌入向量,并采用Circle Loss进行优化。该损失函数可以同时优化所有正样本和负样本,并对困难样本加权。同时,在支撑物体和查询图像中的每个像素之间建立联系,从而帮助网络对物体进行精细的像素级分割。2)本文提出了一个单阶段小样本实例分割模型。模型采用Res Net-50孪生神经网络为主干网络提取特征,并将图像分为若干个网格,同时通过FPN(Feature Pyramid Network)将不同尺寸的物体分离,最大程度地避免了同一网格中有多个物体。与上文中两阶段的小样本实例分割模型不同,本模型直接对图像中的物体进行全图像素级分割,并根据实例类别预测和实例掩码分割两个分支的特点及复杂度的不同,采取相对应的方法。在实例类别预测分支利用支撑图像的全局特征进行特征融合;在实例掩码分割分支引入图卷积进行关系推理,建立支撑图像与查询图像之间的关系。本文所提出的模型在COCO 2017验证集上与其他最新的小样本实例分割模型进行了全面的对比实验,其性能相较于其他模型有比较明显的提升。大量的消融实验保证了模型各个模块的有效性以及参数设置的必要性。可视化实验直观地展现了模型的训练过程和测试结果。
其他文献
在新课程改革背景下,“读后续写”“以读促写”的理念逐渐进入到教师的视野,“读”与“写”的融合也受到了英语教师的广泛关注。读后续写教学可以保证学生获得小篇幅的、比较灵活的读写训练,进而提升写作能力。立足具体实践,从“课前准备”“文章导读”“读后续写”“写后评价”四个阶段分析如何开展高中英语读后续写教学。
随着课改的不断深入,部编版初中语文教材中古诗文的占比在不断增加,这对教师的教和学生的学都提出了更高的要求。吟诵法教学在初中古诗文课堂中处于初级探索阶段,克服传统诗词教学的局限性,提升学生的文学素养和语言技能是吟诵法教学进入课堂需要面临的现实问题。本文通过调查吟诵法的教学现状,提出吟诵教学存在的一些问题并进行反思,总结了一些吟诵法教学的运用策略。
随着大数据时代的来临,基于卷积神经网络的目标检测算法在深度学习技术的发展下逐渐趋于成熟,而这些都依赖于大量的带有标注的训练数据。在某些样本稀缺的应用场景下,传统的深度学习型目标检测算法面临严重的过拟合问题,导致检测效果极差。因此,为了提升小样本条件下的目标检测性能,本文基于现有的前沿目标检测算法YOLOv5,针对其在小样本条件下即使采用迁移策略,也较难兼顾目标定位和目标分类的问题,提出了双阶段小样
文化意识是核心素养的价值取向,弘扬中华优秀传统文化是建构学生文化意识的重要内容。教师应针对文化意识培养目标,通过文本阅读,有效利用文本阅读的价值,将文化意识培养融入英语阅读教学,从激活文化背景图式、感知文化现象、探究文化内涵、评析文化价值等方面入手,提升学生的民族自信心和自豪感,坚定学生的文化自信,培养学生的英语学科核心素养。
研究背景子宫内膜异位症(Endometriosis,EM)是一种常见的妇科疾病,在育龄期女性中的发病率大约为10%,可以引起痛经、慢性盆腔痛和不孕等症状,在严重影响女性身心健康的同时给社会造成巨大的经济负担。目前对该疾病的治疗方法有限,并且均存在副作用大和治疗后易复发的缺点。但是子宫内膜异位症发病机制尚不明确,经血逆流可能是其诱因,免疫微环境的改变在EM的发病中发挥重要作用。深入机制研究,探索针对
目标检测技术在计算机视觉领域无论是学术研究还是现实应用中都是最热门的技术之一。目前,主流的基于深度学习的目标检测方法大都需要大规模的标注数据以实现检测模型的训练过程,但是在部分特殊场景,如稀有动物、军事安全与罕见疾病等领域想要获得大量的样本数据进行标注以及完成目标检测模型的训练任务是比较困难的。因此,基于小样本情景下的目标检测技术应运而生。本文基于样本数据增强,图片特征提取,网络模型调整这三个方向
本文主要目的是探讨遥感技术在环境监测中的实施。为了更好地保护自然生态环境,文章首先从遥感技术的内涵入手,具体分析遥感技术在环境监测中的优势,并以此为基础,提出相对应的实施要点,旨在提升环境监测质量和效率,为广大人民群众营造绿色、环保的居住环境。基于此,通过对上述内容进行简单的分析,希望能给其他环境监测工作者提供一定的理论参考和借鉴。
本研究采用资源分配法,通过操纵字体颜色,考察了字体强调对老年人句子理解的影响。结果发现,字体强调消除了老年人与年轻人对词汇水平加工的资源投入差异。字体强调减少了老年人在词汇水平上的资源分配,但是增加了年轻人对词汇水平加工的资源投入。这说明字体强调对两个群体的作用机制不同。另外,相比于词汇水平加工,字体强调对文本基础水平的资源分配没有影响。
用基于工业铂电阻的高精度数字温度计替代标准水银温度计,是当今温度计量的一个研究热点。迄今为止这类产品只能作为工作器具使用,其主要原因是对高精度数字温度计的长期稳定性研究还不充分。介绍了一款高精度数字温度计长达8年的稳定性研究成果,并和标准水银温度计比较,说明用高精度数字温度计替代标准水银温度计是完全可行的观点,同时提出一些具体建议。