论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNN)目前在计算机视觉领域应用广泛,在图像识别、物体检测以及图像分割等问题上都取得了最优的性能。但是CNN是深度的人工神经网络,其前馈传播需要进行大量的卷积运算,而且其网络层数和隐藏层的网络节点数会随着任务难度的增加而增加。因此,CNN过高的计算复杂度,对其在实时性要求较高的应用场景中的使用产生了限制,如对行人和车辆进行检测的交通监控等问题;对其在计算能力较低的设备上的应用也有很大的限制,如移动设备等。本文主要对CNN在图像识别和物体检测中应用的加速方法展开了系统而深入的研究,主要包括以下内容:1.针对CNN在二元图像分类和特定物体检测问题上的应用,提出了一种基于预决策的卷积神经网络加速方法。该方法充分利用了CNN特征的冗余性和多层特征的判别力,建立了基于CNN的级联分类器,实现加速。在构建级联分类器的过程中,对于每一阶的特征选择,提出了特征点选择模型。特征点选择模型充分考虑了CNN各层特征点的分类能力和计算代价,跨层进行特征点的选择,所选特征点的分类能力和计算代价整体最优。本文分别在CIFAR-10、Pascal VOC2007、INRIA和TRECVID等数据集上对该方法进行了测试。实验表明,对于二元图像分类和特定物体检测问题,该方法在有极小性能损失的情况下,能实现较大的加速。另外,该方法可以与很多之前的CNN加速方法结合起来使用,实现更大的加速。2.对基于预决策的卷积神经网络加速方法进行了系统实现。该系统主要包括:特征点选择模型训练集提取模块、CNN网络结构量化模块、特征点选择模型训练模块、级联分类器建立模块。对于深度较大和比较复杂的CNN模型,本文提出的方法在训练过程中时间和空间复杂度都非常大,该系统使用了一些实现技巧,大大压缩了模型的训练时间和所需内存空间。