基于深度学习的单阶段目标检测算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：zhq2000

【摘要】

：

【作者】

：

许辉

【机构】

：

国防科技大学

【出处】

：

国防科技大学

【发表日期】

：

2019年01期

【关键词】

：

目标检测深度学习感受野卷积神经网络注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目标检测任务作为在图像处理和计算机视觉领域中的基础课题之一,在图像检索、视频监控、人脸检测、人机交互等方面上有着广泛的应用。传统的目标检测方法首先是对给定图片进行特征提取然后再进行分类抉择,因此特征提取的好坏对目标检测的性能起着关键的作用。相对于传统的目标检测方法,基于深度学习的目标检测方法通过大量数据训练能够自适应的学习到较好的特征提取方法,可以更好的在复杂场景下进行检测。目前比较流行的基于深度学习的目标检测方法分为两种:第一种是两阶段目标检测方法,另一种是单阶段目标检测方法。两阶段目标检测方法首先需要对图片进行区域划分,然后再进行检测。单阶段目标检测方法是输入图片后能够直接输出检测结果。两阶段的方法相对于单阶段方法而言准确度上有一定的优势,但是候选区域划分的过程计算量较大,不能满足实时性的要求。因此本文对单阶段的目标检测方法进行研究。本文工作和主要研究成果主要包括以下几个方面:（1）SSD目标检测算法中参与预测的不同尺度特征层之间并没有过多联系,为了提高上下文之间的联系,本文基于融合注意力机制将不同尺度卷积特征层的信息进行融合。融合注意力机制是一种全新的注意力机制,它首先通过尺度操作将不同尺度的特征层进行尺度统一,然后通过卷积以及矩阵乘法将上下文的信息引入到SSD算法中。在PASCAL VOC数据集上,实验证明了引入上下文信息的改进SSD算法相对于原始的SSD算法在m AP性能上得到了更好的效果。（2）SSD算法的前馈网络采用的VGGNet16网络结构,虽然VGGNet16是比较经典的模型之一,但是由于神经网络层数较浅效果有待提高。因此本文将SDD算法的前馈网络替换成层数更深效果更好的残差网络,构造一个新的模型结构Res Net-SSD。通过实验证明虽然将VGGNet16替换成残差网络但是效果并不会提高,它的m AP性能反而有所下降,但是在添加融合注意力和共享预测模块后,用残差网络作为前馈网络的模型准确度优于用VGGNet16作为前馈网络的模型准确度。（3）在目标检测任务中,针对感受野不足的问题,本文提出了共享预测模块（Shared PM）,通过利用空洞卷积（膨胀卷积）来增加不同特征层的感受野范围,同时为了减少参数量并提高计算效率,本文采用了共享卷积参数的操作。实验证明在基于融合注意力改进的SSD算法基础上加入共享预测模块在PASCAL VOC数据集上能获得更好的m AP性能。

其他文献

基于深度学习的低空无人机目标图像检测识别算法研究

随着自动控制技术的发展,民用无人机越来越广泛的应用给社会带了来许多便利,但也对个人、社会、军事等领域带来了严重威胁。因此,快速高效的低空无人机检测是应对无人机威胁的前提。本文利用红外与可见光波段的光电探测手段,结合深度学习技术,开展了对低空无人机目标图像检测识别算法的研究,主要工作内容如下:（1）基于深度学习的低空无人机检测识别算法优选。首先,利用红外与可见光采集设备与3型民用无人机构建了双波段无

学位

目标检测深度学习网络结构优化图像融合双波段无人机数据集双通道卷积神经网络

基于深度学习的三维室内场景语义分析研究

随着智能家居机器人、无人驾驶、虚拟现实等新兴产业的爆炸式发展,对三维场景的语义分析与理解的需求也越来越紧迫。与此同时,空间扫描技术的越发成熟,三维传感技术也取得了重大进展,大量的真实场景三维点云数据的获取也越来越容易。为此,三维场景的语义分析也越来越受到数据的驱动。由于三维点云数据的无序性,基于卷积神经网络的深度学习方法不能直接作用于点云上,而将点云数据转换为体素,采用三维卷积方法的计算开销太大,

学位

深度学习点云室内场景语义分析

去焦虑，强动机：学生参与式单元作业设计

作业减负，关键在于消除学生的作业焦虑，提升其学习主动性。这就需要打开作业“黑箱”，将作业纳入学习过程之中，让学生参与到作业评价中来。作业设计可秉持评价标准共定、及时/持续反馈、作业前置及结果可视四项原则。教师可尝试重构作业设计思路，引导学生理解作业目标，与学生共同协商任务内容、商定评价标准，同时注重作业反馈，指导学生改进，让学习为作业提供支架，用作业改进学生的学习表现，使学习与作业一体发展，增强学

期刊

作业减负单元作业设计表现性评价评价标准

基于无监督学习的通信辐射源个体识别技术研究

通信辐射源个体识别（又被称为通信辐射源指纹识别）是通过测量发射机反映在信号上的差异对信号和发射机进行关联,在电子对抗中发挥着重要作用,是现代电子战中不可缺少的手段。本文主要研究无监督条件下通信辐射源个体识别,开展的主要工作如下:（1）将无监督学习引入到通信辐射源个体识别中,开展基于密度峰值聚类算法的通信辐射源个体识别方法研究。首先在双谱的基础上计算通信辐射源观测信号的直方图特征,提高其个体信息表征

学位

通信辐射源个体识别无监督学习直方图特征密度峰值聚类增量学习

中美在人工智能领域的竞争与合作研究

人工智能有望成为新一轮科技革命、产业革命和军事革命的核心驱动技术,对于促进国家的经济发展、军事赋能和增长政治影响力方面都有巨大的应用潜力,因而也成为了国际竞争的新焦点。中美两国均高度重视人工智能这一领域,纷纷出台了战略政策文件助推其研发和应用,进行着激烈竞争。但另一方面,中美在人工智能领域仍存在着诸多合作。如何理解在中美战略竞争背景下,两国在人工智能领域仍存在着广泛而密切的合作关系?中美在人工智能

学位

人工智能中美关系分析折中主义大国竞争合作

文学翻译的等效性及实践探索 ——《那个未曾谋面的人》英汉翻译实践报告（第一至四章）

2001年发生在美国的9·11恐怖袭击,其影响之大、之广、之深远远超出我们的想象。对全世界而言,它是一个改变了世界格局的历史事件;对于美国而言,它是一次改变了国家政治形态的恐怖袭击;对于美国内民众而言,它是一场摧毁对未来期许的灾难。时隔多年,当时深受9·11之害的个人和家庭,今之何如?亚当·谢夫特的最新小说《那个未曾谋面的人》给了我们答案。本篇翻译实践报告的原文节选自《那个未曾谋面的人》一书。小说

学位

9·11文学功能对等理论奈达文学翻译

基于深度学习的低分辨雷达目标识别技术研究

现代战争对雷达目标识别提出了更高的要求,由于现役雷达大部分是低分辨雷达,对其开展目标识别技术的研究具有重要军事意义。在小样本、样本不均衡等复杂电磁环境条件下,传统低分辨雷达目标识别方法存在泛化性较差、识别率较低等问题。本文围绕深度学习方法对低分辨雷达目标识别技术开展研究,主要研究内容如下:传统低分辨雷达目标识别技术采用先提取信号特征,再基于特征进行识别的两步识别方法。论文首先研究了基于深度学习的低

学位

低分辨雷达目标识别卷积神经网络生成对抗网络

论“穿透式”行政检察监督

"穿透式"行政检察监督打破行政诉讼固有"遮蔽",弥补行政检察监督缺位,是参与社会治理多元主体中不可替代的重要力量。"穿透式"行政检察监督多层穿透,具备坚实的理论基础。不仅如此,其通过发挥"一手托两家"的监督作用,在司法实践中具有监督行政诉讼活动、促进依法行政、实质性化解行政争议、提升社会治理能力的制度优势。实现"穿透式"行政检察监督之功效,应遵循精准监督、双重监督、实质监督、类案监督的监督理念,同

期刊

“穿透式”行政检察监督实质性化解行政争议社会治理

基于深度学习的图像语义分割算法研究

图像语义分割技术是目前计算机视觉技术领域中的热门研究方向,其研究具有重要的军事及民用价值。随着军事智能化要求的提高,语义信息发挥越来越重要的作用,这更加促进了语义分割技术研究的发展。本文以公开大规模数据集中的场景和物体作为研究对象,对图像语义分割算法展开了研究。研究重点内容包括以下三个部分:（1）介绍了语义分割技术的发展现状,对目前国际上主流的语义分割算法进行了归纳总结。在对目前国际上使用最广泛的

学位

图像语义分割金字塔池化超像素分割条件随机场Atrous卷积

基于深度学习的三维雷达图像目标分类方法

随着毫米波近场成像系统在安检等领域发挥作用,针对三维雷达图像的目标分类与检测方法具有了重要的理论研究和应用价值。三维雷达图像包含丰富的三维空间信息与雷达成像特征,本文尝试通过深度学习的方法,充分分析利用三维雷达图像具有的特点,深入研究针对三维雷达图像的目标分类方法。第一章论述了该课题的研究背景和意义,分三个小节详细总结了三维雷达图像目标分类的深度学习方法相关领域的发展现状,在此基础上归纳了本课题需

学位

三维雷达图像目标分类深度学习图形电磁计算多视图数据融合点云

基于深度学习的单阶段目标检测算法研究

其他学术论文