论文部分内容阅读
国民收入不断攀升,为了追求更加便利的生活,机动车的购入成为了首选。商家为了吸引消费者也推出了更多、车型更多元化的汽车。汽车数量激增使得智能交通系统的重要性越来越突出。车型识别可以说是智能交通系统中至关重要的一个环节,车型识别的关键是特征提取。传统算法中,要提取有效的特征往往需要相应领域的先验知识,因此研究者们提出针对自身领域的特征。但是如果将这些特征直接应用于大规模图像识别常常达不到很好的效果,并且需要耗费大量时间设计和调优。随着卷积神经网络的发展,研究者们开始从设计特征转而研究学习特征。卷积神经网络自动提取图像多层次特征满足了自动学习特征的需求。实验证明,卷积神经网络的性能远远优于传统的特征提取算法。与此同时,海量图像数据的出现以及计算机硬件的提升也为卷积神经网络的进行大规模训练带来了很大的机遇。近年来,人们用卷积神经网络研究车型识别主要集中在一些大类别车型之间,比如SUV与小汽车、大卡车等,这些车型之间区分度较高,特征提取较容易。卷积神经网络在这些车型识别上的研究成果已经有了实际产出。但是卷积神经网络在细粒度图像识别方面的研究投入还较少,产生的社会效益也不多。细粒度图像识别又叫子类图像识别,子类车型间存在微小的差别,放到视觉图像上这种差别更加难以区分,识别难度较大,因此这种子类图像识别需要更强有力的特征提取器。本文的主要工作就是对细粒度车型识别进行深入的研究来提升细粒度车型识别的精度。本文主要从数据集和卷积神经网络结构两个方向来提升细粒度车型识别的精度。在数据集方面,利用候选框信息和SRGAN算法等来扩展数据集,并且进行PCA数据预处理来加快训练速度。结果发现利用候选框信息扩充数据集会增加输入图像的多尺度信息,提高识别的准确率。利用SRGAN可以提升数据集的分辨率,由于本文数据集分辨率较高,所以对本文的提升效果不明显,但这种方法可以扩展数据集,防止过拟合,并且在降低数据集硬件采集设施要求方面有很大的帮助。在网络结构方面,从VGG、Inception、ResNet这三种结构的实验对比中发现多尺度信息对于细粒度车型识别更有效,而提取多尺度信息的关键不在于加深网络深度,而在于扩展网络的宽度,Inception这种结构就可以有效的提取到多尺度信息。除此之外,本文通过人工标注信息采用Faster-RCNN对车型进行检测识别去除背景信息干扰,实验表明可以提升识别的精度。