基于深度学习的弱监督目标检测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xingke198621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习在计算机视觉领域中展现出令人振奋的性能。作为其重要的理论分支,目标检测技术已广泛应用于目标识别、视频监控、卫星遥感、医学成像等军事民用领域。然而,基于强监督学习的检测模型在训练时需要人工标注所有对象的位置信息,会消耗大量的时间和人力成本。因此,弱监督目标检测成为了一个重要研究方向。本文以此作为出发点,围绕不确切监督的弱监督学习方式展开研究。目标检测任务需要完成定位、识别两项工作。目前,基于弱监督方式的定位模型大多依赖于网络自身的特征提取特性进行初步定位。然而,用该方法生成的热力图仅趋向于关注目标中具有鉴别性的区域,难以覆盖目标整体。针对这一问题,本文结合基本卷积神经网络模型中不同特征层空间维度、通道维度的可视化结果,提出了一种基于双注意力掩模的弱监督目标定位模型。模型利用空洞卷积保留浅层细节特征,并借助注意力机制与连通域分析整合不同维度的特征分布,使网络模型关注点向目标主体聚集,从而减少背景信息的干扰。此外,通过掩模机制迫使网络寻找更多感兴趣区域,提高网络对目标整体区域的特征提取能力。最后,通过各模块对比分析确定最佳结构参数。实验结果表明,本文模型较之其它方法在分类、定位精度上均有所提升,且具有更好的细节保持及对目标整体形态的把握能力。现有的弱监督检测模型大多遵循基于候选区域提取的两阶段检测思路。由于仅从网络深层提取特征,检测视野较为固定,易出现目标粘连及多目标识别能力差的问题。此外,由于区域提取时无法预知检测对象的位置、类别信息,需要大量候选框来拟合所有可能目标,会造成大量冗余。针对这一问题,本文根据检测任务中不同尺度特征层的特性分析结果,提出了一种基于特征融合和定位筛选的弱监督目标检测模型。该模型通过融合浅层平移可变性特征与深层上下文信息以调节融合层的特征分布,增强其对多尺度目标位置、细节的敏感度。此外,针对候选框冗余问题,提出了一种新的候选框筛选方案。该方案借助融合热力图生成代替真实标注的伪标签,利用定位方法有效缩小了预选区域提取的范围。同时,通过计算所有候选框与伪标签的交叠率、像素响应率两方面的加权结果对候选区域进行评估,筛选出Io U较高且包裹目标更为紧密的候选框。本文模型在经典检测数据集PASCAL VOC上进行测试,从检测精度、定位精度两方面分别验证其有效性。实验结果表明,本文模型在单类别精度、总体精度上均有一定程度的提升,且提高了对小尺度目标的检测精度。本文结合弱监督学习中类激活映射和多示例学习两种重要方法进行模型的设计优化,提出了新的弱监督目标定位模型和检测模型。所有模型在训练时仅依赖于图像级标签进行监督,不需要提供强监督的边框级信息。实验结果表明,本文模型具有良好的检测、定位效果,对弱监督方式下的相关任务具有一定指导意义。
其他文献
改革开放40年来,中国经济在高速增长态势下取得了长效稳定的发展,但与此同时我国能源消耗和碳排放量剧增。据《BP能源统计年鉴(2009)》数据显示,我国能源消费总量于2009年超过美国,成为世界能源消费量最大的国家。为贯彻落实绿色发展理念、履行我国在国际社会上提出的单位国内生产总值(GDP)的CO2排放量到2020年较2005年降低40%~50%、到2030年较2015年水平降低60%~65%减排承
学位
随着全球化的不断推进,不同语言的交流变的越来越频繁,多语言学习也变的越来越重要。语言的理解不仅仅是对于语义文本的了解,其中情感的差异也会对语意理解产生影响。因此对
绝版木刻在中国当代版画史上占有一席之地,它特有的表现方式开拓了版画创作新的生命力,弥补了传统套版套色的不足,打破了传统的制约,在制版和印刷层面有了新的突破。但是,绝版木刻多年的创作中没有较大变化,发展较为缓慢。如何拓展其潜力,发掘绝版木刻的创作空间,重新幻发活力,这些都是值得深究思考的问题。因此,本人对这一问题进行了大量的研究,探索绝版木刻制版过程中的“自由性”,为绝版木刻的发展做出一点微薄的贡献
慢性难愈合创伤所引起的包括功能受限、感染和恶性转化等并发症已经成为临床亟待解决的问题。导致伤口无法愈合的机制之一是自我维持的、不受控制的炎症反应。因此,设计开发具有能下调免疫细胞活性的皮肤再生修复敷料,减少炎症因子的释放,缩短炎症周期,这将是促进慢性难愈合创面修复的一种可行策略。近年来,糖蛋白作为一种多功能生物大分子,其逃脱免疫系统监控,减少炎症等性能,使其有可能作为生物材料的备选。考虑到获得大量
随着云计算及生物信息学技术的发展,电子医疗数据因其快速、全面地采集、存储、处理和传输医疗信息的能力,成为医疗信息的核心建设内容,也开启了互联网+智慧医疗的新纪元。通常,电子医疗记录常常涉及用户的隐私信息,需要被妥善地存储和处理。为确保数据的机密性,健康数据常以密文形式存储在云中,然而加密的状态会给数据的共享、搜索、测试等方面带来极大挑战,现有基于明文的搜索、测试等技术也不能直接运用于密文,需要先解
心理安全是人的基本需求之一,作为学生理所当然有其课堂安全需求,我国对课堂安全感的关注由于传统文化等原因长时期未能显发出来。近些年,学界逐渐注意到学生的主体性价值,以
亚当·沙夫(Adam Schaff,1913--2006)不仅是波兰著名的哲学家,而且是东欧新马克思主义的重要代表人物。沙夫坚持并发展了马克思主义关于人的哲学、异化理论、社会自治以及社会主义人道主义等一系列相关的思想和理论。其中,关于马克思主义历史观的思想和理论对当代马克思主义理论的发展和实践应用有着非常重要的促进作用。本文力图在沙夫所处的历史背景下,运用辩证唯物主义和历史唯物主义方法,对其马克思
随着近年来电信业务的快速发展,无线通信的信道频谱变得异常拥挤,而现有的信道复用方法难以扩展通信带宽,这使得有限的频谱资源与对通信速率日益增长的需求之间的矛盾愈来愈不可调和。同时,无线信号间的相互干扰越来越多,给无线电技术的广泛应用带来了极大的不便。如何利用现有的有限频谱来最大限度地提高通信速率和通信容量,是世界范围内无线通信技术研究人员共同关心的热点问题。2007年,Bo Thide等人首次将涡旋
学位
《滇西抗日战争史》属于历史型文本,其内容权威、客观、真实。该书包含大量珍贵史料,具有较高学术价值,在云南当代战争史研究领域享有较高声誉。翻译该书可以为英语读者提供详细史料,有利于滇西抗战历史事件的国际传播。本翻译项目选自该书第一章和附录部分,主要讲述滇西抗日战争爆发前夕国内外形势,以及1937年11月至1946年11月期间发生的重大历史事件。在对翻译项目进行分析以及对比各种译论之后,译者选择关联翻