论文部分内容阅读
场景识别作为计算机视觉的重要分支之一,在无人车,无人船的自动驾驶中起着关键性作用。场景识别的方法一般分为以下三种:第一种为基于底层特征的场景识别方法,这种方法需要人为的提取图像特征,对于数据庞大且场景特征信息较多的目标而言,这种方法耗时耗力,且训练的网络泛化能力较弱;第二种是基于场景模型的场景识别方法,这种方法需要人为的设置一些场景模型,每个场景模型中包含了单个场景中可能存在的各种特征信息,通过训练场景模型,并将需要识别的场景图片分别与场景模型匹配,得分最高的场景即为识别的场景,这种方案的识别效果一定程度上优于第一种,但是当场景中的同类元素过多时,其识别效果会明显下降;第三种方法则为基于深度学习的场景识别方法,通过构建某种神经网络,然后使用大量的训练集训练神经网络模型的参数,能够自动提取特征,并通过得到的特征信息对给定的场景图片进行分类。随着几年来计算机计算能力的迅速发展,基于深度学习的场景识别方法成为主流。然而传统深度学习的方法中使用的网络一般为线性网络,对于场景识别而言,场景图片中包含的特征信息极为丰富,使用一般的线性网络,无法提取场景图像中包含的多尺度信息,以及场景的上下文信息,而且随着网络层级结构的不断加深,不仅使得神经网络很容易出现梯度消失和梯度爆炸的问题,也会导致网络的收敛时间大大加长。
本文使用水上场景数据集作为场景识别的研究对象,针对水上场景的特点,对传统神经网络的图像特征提取过程,特征融合过程,以及神经网络的收敛效果,做出了针对性的改进。实现了针对水上场景数据集的高准确度识别。
采用并行网络结构对需要训练和识别的场景图像做多尺度的特征提取。对于传统的线性神经网络,如AlexNet神经网络,由于水上场景中存在太多重复特征,它无法从多尺度的角度对所需识别的场景图片做特征提取,导致在复杂场景中的识别率很一般。针对这个问题,本文提出了一种四路并行的网络结构,能够有效提取图像中的多尺度特征并有效提高场景识别的准确率。
采用残差网络结构解决在网络层数较深的时候导致的梯度问题。一般来讲,对于某个神经网络训练任务来说,网络的层级结构越深,能够提取到的不同层次的信息就越多,不同层次之间的信息组合也就越多,然而,网络层的加深会导致梯度消失或梯度爆炸的问题,传统上的解决方案是使用数据的正则化和标准化对数据进行处理。这样虽然能够一定程度上解决梯度消失和梯度爆炸的问题,但是却带来了新的问题。随着网络层数的加深,我们发现训练的损失值反而有所上升,这个问题可以使用残差网络结构来解决。通过使用残差网络结构,不仅能够解决梯度消失和爆炸的问题,也能够让神经网络的训练效果进一步提升。
使用计算动词加速神经网络的收敛。传统神经网络的训练学习率通常设为一个恒定值,但是在实际的神经网络训练过程中,学习率应该随着网络的训练呈现一种衰减的趋势,我们可以在初始阶段将学习率设置的高一些,并在神经网络收敛阶段将学习率设置的更低,这样不仅能够加速神经网络的训练过程,也能使神经网络在训练过程中能够跳过某些可能存在的局部最优点,从而使得神经网络有更好的收敛效果。通过使用基于计算动词理论的神经网络优化方法,动态改变神经网络的学习效率,不仅能使神经网络的训练时间大大减小,还能进一步提升神经网络的收敛效果。
本文使用水上场景数据集作为场景识别的研究对象,针对水上场景的特点,对传统神经网络的图像特征提取过程,特征融合过程,以及神经网络的收敛效果,做出了针对性的改进。实现了针对水上场景数据集的高准确度识别。
采用并行网络结构对需要训练和识别的场景图像做多尺度的特征提取。对于传统的线性神经网络,如AlexNet神经网络,由于水上场景中存在太多重复特征,它无法从多尺度的角度对所需识别的场景图片做特征提取,导致在复杂场景中的识别率很一般。针对这个问题,本文提出了一种四路并行的网络结构,能够有效提取图像中的多尺度特征并有效提高场景识别的准确率。
采用残差网络结构解决在网络层数较深的时候导致的梯度问题。一般来讲,对于某个神经网络训练任务来说,网络的层级结构越深,能够提取到的不同层次的信息就越多,不同层次之间的信息组合也就越多,然而,网络层的加深会导致梯度消失或梯度爆炸的问题,传统上的解决方案是使用数据的正则化和标准化对数据进行处理。这样虽然能够一定程度上解决梯度消失和梯度爆炸的问题,但是却带来了新的问题。随着网络层数的加深,我们发现训练的损失值反而有所上升,这个问题可以使用残差网络结构来解决。通过使用残差网络结构,不仅能够解决梯度消失和爆炸的问题,也能够让神经网络的训练效果进一步提升。
使用计算动词加速神经网络的收敛。传统神经网络的训练学习率通常设为一个恒定值,但是在实际的神经网络训练过程中,学习率应该随着网络的训练呈现一种衰减的趋势,我们可以在初始阶段将学习率设置的高一些,并在神经网络收敛阶段将学习率设置的更低,这样不仅能够加速神经网络的训练过程,也能使神经网络在训练过程中能够跳过某些可能存在的局部最优点,从而使得神经网络有更好的收敛效果。通过使用基于计算动词理论的神经网络优化方法,动态改变神经网络的学习效率,不仅能使神经网络的训练时间大大减小,还能进一步提升神经网络的收敛效果。