论文部分内容阅读
随着人工智能越来越多的渗透到我们生活工作的方方面面,人工智能技术中非常重要的分支——计算机视觉受到越来越多研究者的关注。而目标检测技术更是众多计算机视觉任务的必备前提,如事件检测、自动驾驶、智能医疗等。近年来目标检测领域发展迅猛,各种研究成果层出不穷,但是当前的目标检测技术依然有很大的提升空间。本文在大量查阅文献,广泛研究现有研究成果的情况下,对目标检测目前的国内外研究现状、存在的主要问题进行了阐述。之后对目前目标检测的主流方法进行了系统介绍,包括基于深度学习的两段式和一段式目标检测方法。并且对视频目标检测相对于图像目标检测存在的主要难点进行了说明。提出了加权特征金字塔网络用以解决小目标检测精度较低的问题。针对一段式目标检测方法中前景背景样本极度不平衡的问题提出了背景抑制损失函数。在加权特征金字塔网络的基础上提出了针对视频目标检测的交错模型。并开发了集数据处理、模型训练以及目标检测为一体的原型系统。本文的主要研究内容如下:1)针对小目标检测效果不佳的问题,提出了基于多层次深度特征融合的图像目标检测方法。利用卷积神经网络浅层特征具有较高分辨率,深层特征具有较为具体的语义信息的特性。根据不同类型的信息对于最终目标检测效果的重要程度,设计了一个对浅层特征和深层特征进行加权融合的网络结构。使得最终用于检测的特征既能充分利用深层特征提供的高度抽象的语义信息,又能借助浅层特征的高分辨率信息来弥补卷积网络多次卷积后信息不可逆的缺陷。背景抑制函数通过在计算网络损失的时候增大前景分类错误的损失,有效缓解了目标检测过程中前景背景样本极度不平衡的问题。2)针对视频目标检测速度较低的问题,提出了基于交错WFPN的视频目标检测方法。利用视频的时空局部性,使用高精度特征提取网络和高速特征提取网络交叉对视频帧进行特征提取,并通过Group ConvLSTM将不同的特征提取网络进行连接,使得高速特征提取网络能够充分利用前序的高精度特征提取网络提取到高精度特征。通过这样的方式既能够充分利用视频的时空局部性减少冗余计算,又能够合理利用视频的时序信息。实现了速度和精度的良好平衡。3)设计开发了一个集数据预处理、模型训练以及目标检测于一体的目标检测原型系统。系统使用Python作为主要开发语言,PyQT作为用户界面开发框架,PyTorch作为深度学习算法框架。该系统拥有友好的用户界面,灵活的参数设置,直观的检测结果展示等特性。