论文部分内容阅读
近年来,目标检测算法日新月异,然而由于小尺寸目标本身存在的一些固有特征(譬如物理尺寸小、边缘信息模糊等),而因此造成小目标检测精度低且提升难,逐渐成为目标检测任务中难以解决的任务之一。在现实场景中,小目标的存在是普遍且更具实际意义的。因此,提高小目标检测的检测精度显得至关重要。本文使用小目标占比较多的公开数据集——COCO数据集,为了比较目前常用的两种小目标检测基本方法(基于候选框生成和基于关键点回归),本文基于这两种基本方法分别从以下三个侧重点对现有工作进行一定的改进:(1)提出基于候选框生成和多尺度自适应学习的小目标检测方法。基于候选框生成的基本检测方法是常用的小目标检测方法之一,但通常都是以固定锚框的形式为主缺少普适性。为此本文改进原始方法,提出了自适应产生锚框的方式,引导网络利用对不同深度特征图的学习,来匹配出适合目标尺寸的锚框。除此之外,由于目前通用数据集中,包含小目标的图片相比于其他尺寸的目标来说占比较少。为了平衡小尺寸目标与其他尺寸目标在数量上的悬殊,一方面本文设计提出新的平衡损失函数在训练阶段对其他尺寸目标进行惩罚从而增加网络对于小目标特征学习的关注外,另一方面提出增强多尺度特征学习模块,加强网络对于多尺度特征信息的关联,在COCO数据集上小目标检测AP值最多可提高18%。(2)提出基于关键点回归和上下文敏感的小目标检测方法。考虑到基于候选框生成方法存在的缺陷,本文改用关键点回归的基本检测方法,一方面能够规避这些问题,另一方面也简化了预测前期所需要做的预处理操作。针对关键点回归的方式,本文改进堆栈沙漏特征提取模块来增强基础网络对于物体周围上下文信息的学习。为了减少网络池化过程中对于小目标信息的丢失,引入方向池化操作代替原有的下采样操作,使得小尺寸目标的检测在COCO数据集上得到了显著的提升。(3)提出基于单关键点回归和尺度感知的小目标检测方法。常用的关键点回归方式,一般是在图像上预测多个关键点。本文改用基于单关键点回归的方法简化网络的后处理操作,在检测结果过程中提升了检测速度。为了进一步从卷积神经网络的基本结构上增加网络不同深度像素点的感受野范围,设计提出RE卷积操作代替部分传统的卷积操作应用于小目标检测,相比于前两种方法该方法检测精度更高。