论文部分内容阅读
一般来说,同时检测物体的类别和位姿是非常困难的,很多的经典图像处理算法无法达到足够的精度。目前,深度学习技术的不断发展,使用深度神经网络进行物体检测能够获得更高的准确率。基于深度学习方法构建的网络结构不完全相同,一些方法使用两阶段的网络结构,其中第一段是用来检测物体的位置,第二段用以检测物体的旋转方向。但是,这样就会增加物体检测的时间,效率较低。另一些方法则使用单通道的网络结构,实现直接获取物体位姿的目的。本文主要以RRU模块中电源口和光口为检测对象,并且当检测物体的旋转方向时,本文通过检测物体的方向性关键点来获取物体的旋转角度。针对电源口和光口的这种四边形物体,本文使用从左上角到右下角的逆时针方向的四个角作为关键检测点。之后,根据关键点的个数设计了一个单通道结构的深度神经网络,用以检测方向性关键点的位置,该网络称为Single Shot Directional Points Detector,简称为SSPD。同时,为了便于四个角点的检测,本文使用八个参数用于表示SSPD网络结构中的边界框信息。此外为了包含检测过程的方向性信息以及提高关键点位置的检测精度,本文提出一种旋转先验边界框。并且,为了利于网络训练过程中新边界框之间的匹配计算,本文提出一种匹配准则。在获得关键点位置之后,本文使用一种计算方法能够最终获得物体的旋转角度。在总体设计完成之后,本文对数据采集、增广和标注方式进行了详细说明,并且编写了标注程序。之后,本文根据检测目标设计了对应的损失函数,该函数用于指导深度网络的学习方向,并使用随机梯度下降算法训练深度网络参数,使其收敛。经过实验验证,训练好的深度网络检测效果良好,在实际采样的数据集上,SSPD模型达到了71%的m AP。整个实验是基于深度学习框架Caffe实现的,本文着重对整个实现过程进行了详细说明。在实验过程中,本文使用了不同的训练方式,并将不同方式训练后的检测效果进行了对比说明。最后,本文使用经典图像处理方法对物体的旋转方向进行检测,并将实验结果与SSPD进行对比。结果证明,深度学习技术能够轻易克服经典图像处理算法不容易解决的问题,并且检测精度更高。