论文部分内容阅读
城市现代化进程的加速和车辆数量的增加导致道路交通安全和运输效率的问题日益突出,例如交通拥堵加剧,交通事故频发。道路交通标志识别(TSR)系统是智能车辆的重要组成部分。该系统收集并识别驾驶过程中出现在道路上的交通标志的信息,能够及时向驾驶员发出指示或警告。必要时甚至直接控制车辆以确保交通顺畅,防止事故发生。现有的基于计算机视觉的交通标志识别方法存在以下问题:(1)现有方法主要聚焦于交通标志自身特征的提取,忽略了交通标志与场景中其它对象之间的空间位置约束关系。这使得系统容易将场景中其它类似的目标检测为交通标志。(2)现有的方法对小型交通标志的识别性能较差。针对现有方法容易出现误识别的问题,本文提出了一种基于场景分析的候选区域提取算法。该方法首先采用语义分割框架DepLabv3+对驾驶环境内的场景目标进行语义分割,包括道路、交通标志、人行道、建筑物等目标的分割。为了滤除场景中相似的物体,本文构建了一个基于交通标志与其它物体之间具有空间位置约束关系的场景结构模型以建立可信的搜索区域。根据现实场景中交通标志出现的位置,为场景结构模型定义了三个搜索区域,分别位于道路的左边,右边和上方。利用位置信息可以过滤掉场景结构模型外不可信的候选对象,保留有效的交通标志候选区域。针对现有方法对小目标识别性能差的问题,本文提出了一种基于密集连接,多尺度特征融合和Jaccard K-means聚类的新网络,新网络命名为多尺度密集连接目标检测器(MDCOD)。该模型构建了 Detail-attention DenseNet作为基础网络,同时引入密集连接来克服深层网络的梯度消失和参数过多的问题,提高了初始特征提取的性能。多尺度特征融合是通过学习一半,重用一半的方法(Learning Half and Reusing Half)来实现的,这改善了特征提取过程中浅层特征不足的缺点。目标预测在模型中的十个特征层上进行,通过实验验证,这些特征图适合于小目标识别的任务。在卷积预测中,默认框的长宽比与真实标注框接近有助于提高交通标志定位的准确性。为此,本文提出了一个Jaccard K-means算法为默认框选择最佳长宽比,使得默认框的比例更加符合交通标志的分布规则。本文对提出的方法进行了综合实验,实验结果表明,本文所提出的基于场景理解的候选区域提取算法能够很好地区分交通标志和相似目标。该方法在清华腾讯100 K和德国交通标志检测基准数据集上进行了测试,其准确率分别为92.3%和99.90%,优于现有方法。