基于Faster RCNN的领域自适应目标检测改进方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:swxylq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉的基本任务中,目标检测毫无疑问是应用最广泛的算法。在完成目标识别任务的基础上,目标检测任务还要将不同类别的目标用不同颜色的矩形边界框表示出来。最近,基于深度学习的目标检测算法向人们展示了非常强大的能力。这些方法通常假定有大量标记的训练数据可用,并且训练和测试数据来自相同的分布。然而,这两个假设在实践中并不总是成立的。在现实中,训练集和测试集的数据往往存在很大的不同。这将会导致检测准确率的降低。因此,开发一种算法,使目标检测模型能够在面对各种域转换任务时仍保持较高的检测准确率是很有必要的。为了更精准的在各种条件下探测到目标,需要领域自适应技术结合进目标检测方法。深度领域自适应算法在图像分类任务中展示出其优势之后,人们期望利用深度领域自适应算法提高目标检测的性能。近年来,人们对领域自适应技术在目标检测任务中的实验进行了深入的研究,并提出了一些方法。目前的领域自适应目标检测方法主要包括基于对抗的方法、基于差异的方法、基于重构的方法和混合方法等等。其中Domain adaptive Faster RCNN算法是一种基于对抗经典的领域自适应目标检测方法。研究发现,基于对抗的方法与各种自适应机制的结合具有更好的性能。但与直接使用目标域数据训练的检测器相比,这些方法在准确率上还有很大差距。因此,如何进一步提高领域自适应目标检测方法的准确率是需要我们进一步研究的。本文受到传统目标检测方法的启发,Faster RCNN方法有着准确率高的优点,并且级联的策略可以将此准确率进一步提高。因此本文基于Domain adaptive Faster RCNN算法对领域自适应目标检测方法进行两点改进。首先利用三层级联的结构来解决误匹配和过拟合问题,采用再采样策略,逐层提高候选框的质量,从而提高检测准确率。传统的Cascade RCNN方法需要手动设置各个级联层的候选框阈值,要找到最合适的阈值是一个耗时的工作。众所周知,目标检测的准确性在很大程度上受到正负样本是否平衡的影响。基于以上两点启发,本文提出自适应阈值策略来保证正负样例的相对平衡。综上所述,结合级联策略和自适应阈值策略,本文将改进的方法称作自适应阈值级联Faster RCNN领域自适应目标检测算法(ATCFR)。本文使用Cityscapes、Foggy Cityscapes、SIM10k和KITTI四个经典数据集来评估提出的改进方法(ATCFR)。实验结果表明,与目前最先进的方法相比较,本文的方法(ATCFR)在面对大多数域转换的情况下有着更高的准确率。
其他文献
近年的高考物理电学实验中,以定值电阻为背景的设计性试题层出不穷。定值电阻在电学实验中的作用灵活多变,但很多学生不知道定值电阻的作用和其对电路的影响,故对它的选用感到无从下手。鉴于此,本文结合往届高考试题,对电学实验中定值电阻的主要用途进行简单小结。
无人驾驶技术在计算机技术和人工智能技术快速发展的推动下,正在全球掀起热潮,众多科技公司、整车厂和高校都在积极探索无人驾驶技术。无人驾驶技术不仅能够给人类的日常生活带来极大的便利,同时能够在生态保护、安全交通、缓解城市交通压力等方面提供完美的解决方案。无人驾驶的实现需要传感技术、定位技术、融合预测技术、决策规划技术、线控技术等协调发展。为实现汽车的无人驾驶,一个重要的亟待解决的关键技术便是自主换道技
随着自动驾驶的研究逐步走向实用化,人们对自动驾驶准确性与安全性的要求也越来越高。自动驾驶系统是一个高度自治的系统,包括感知模块,路径规划模块,行为决策模块和自适应控制模块,其中行为决策模块是确定自动驾驶汽车安全性和稳定性的关键技术。现有的主要决策算法可以分为三类:基于规则的方法,强化学习方法和深度学习方法。基于规则的方法对于简单场景的准确性很高,但是规则制定方法的复杂性限制了它在复杂环境中的进一步
根据中国癌症中心发布的报告,脑癌是发病率第二高的儿童癌症,也是15-34岁成年人癌症死亡的第三常见原因。脑癌的治愈率并没有随着科技的进步而提升,只有及时发现并及早治疗才能有效提升患者的治愈率与存活时间。随着医疗影像技术的进步和推广,核磁共振技术(MRI)成为了脑癌的主要诊断方法,该技术可以帮助医生在不通过外科手术的情况下诊断出脑癌。但医疗影像的判读需要医生拥有丰富的临床经验,同时筛查细节较多的脑部
远监督关系抽取任务通过将知识库中的关系事实与语料库对齐自动产生训练数据,有效地减少了手工标记数据的成本,并且被广泛地应用在大型语料库中以查找新的关系事实。然而该方法在自动生成训练数据的同时却不可避免地引进了大量的噪声数据,这对于模型的训练很不利。在这里我们利用互信息分别从句子级和单词级进行降噪,以解决此问题。我们的方法均是通过有效句子间的互信息实现,而该信息的获取主要基于“有效句子间是存在联系的,
多细胞生物依赖多种分化的细胞密切合作,共同完成复杂的生命活动。通过对单个细胞和细胞间的相互作用分析来揭示生物体内的活动,可以达到对细胞间差异的发现和对疾病进行精准治疗的目标。在对细胞中蕴含的信息进行研究时,会采用不同的技术进行研究与分析。随着单细胞研究投入的增加,单细胞相关技术大量涌现,积累了大量相关数据。然而,研究者们难以从海量的数据中获得有效的信息,提出快速高效的机器学习算法对单细胞相关技术的
人体姿态估计作为行为分析以及动作识别的重要技术,在计算机视觉中具有非常广阔的应用前景。近年来,虽然深度学习在一定程度上极大地促进了人体姿态估计相关工作的进步,但如何将人体模型更好的融合到卷积神经网络中,如何在保证高精度的同时提高网络的处理速度,如何对人体姿态的先验知识实现更充分的利用仍然具有特别重要的研究意义。因此本文以基于深度学习的姿态估计算法为主要研究内容,旨在设计出一种更高效,更准确的姿态估
在数字化正畸治疗过程中,对锥形束CT(Cone Beam Computed Tomography,简称CBCT)图像检测出单个牙齿的位置和牙号是帮助了解正畸治疗的有效手段,也是下一步进行单个牙齿分割的必要前提。近些年随着深度学习算法的蓬勃发展,基于卷积神经网络(CNN)的目标检测算法在医学图像领域的应用热度也逐渐高涨。但CBCT不同于自然图像,既包括CT和图片在自身维度和数据格式上的差别,例如:C
由于全球能源的短缺以及地球环境的不断恶化,近年来,汽车行业向新能源方向飞速转型发展。而燃料电池在工作的时候仅氢气与空气反应,产物仅为水,具有节能环保、安全高效等特点,且其相较其余新能源车型具有续驶里程长、燃料加注时间短等优点,必将成为今后新能源汽车的发展趋势。本文中,燃料电池汽车采用质子交换膜燃料电池(PEMFC)与锂电池组合的方式,PEMFC提供主要电能,锂电池组辅助提供电能,单独或协同工作,为
油田开采过程中涉及的项目种类比较多,因此需要应用大量的生产设备,同时还要涉及油田开采过程中需要的原材料、产品等,一些产品和原材料具有易燃易爆、有毒有害等特点,所以我们要高度的重视油田采油现场的安全管理工作。本文主要阐述了采油现场常见的危险源,对采油作业现场常见的安全隐患分析,根据实际情况制定采油作业现场的危险预防与控制措施。