论文部分内容阅读
目标检测是计算机视觉领域中的一项研究热点,其主要目标是从图像中找到目标物体并定位。近年来随着深度学习的快速发展,基于卷积神经网络的目标检测已经达到较高的检测精度和检测速度,然而该技术还有很大的提升空间,小目标检测、定位不精准、检测速度较慢、图片背景复杂、虚检、漏检等问题对目标检测算法具有很大的挑战性。首先,本文针对目标检测算法中存在的问题,提出了基于多特征融合的目标检测框架。该框架针对目标检测算法中的小物体漏检和检测框不准确的问题,采用了多层特征融合的多特征图,结合了低层的原始图像信息和高层的语义信息。同时,为了提高目标检测的速度,改进了锚框的生成方法、锚框数目和锚框的初始大小。最后,针对定位不准确的问题,本文在维度上改进了传统的一维坐标损失函数,实现了二维重叠面积损失函数。基于公开的PASCAL VOC数据集,可以验证本文算法具有更高的检测精度和速度。其次,本文针对目标检测中的地标线道路要素检测的实际应用场景,提出了一种改进的端到端快速目标检测框架。在实际复杂的道路场景检测中,由于存在车道线、斑马线、菱形标志、文字、阴影、车内反光物等干扰因素,使得虚检较高;且由于存在阴影、尺寸较大、尺寸较小、角度倾斜、磨损、过曝等实际场景,导致漏检较多。因此针对上述问题,本文提出了困难样本挖掘、新的损失函数、锚框预训练、图像预处理、调节参数等改进方法,基于自制的地标线数据集,在召回率、准确率和剔除率三个评价指标上均有较大程度的提升,实现了实际道路中地标线要素的实时检测。