论文部分内容阅读
目标检测是许多计算机视觉任务的基础,广泛应用于自动驾驶、视频监控和图像检索等实际场景。本论文对一阶段实时目标检测方法和基于几何约束的目标检测方法进行了深入研究,主要研究成果如下:针对一阶段实时目标检测方法在进行尺寸较小目标检测时出现的问题,本文在不影响实时检测速度的基础上,设计并实现了一个小目标敏感的一阶段目标检测方法。当前一阶段目标检测方法在小目标检测中存在两个问题:(1)锚点框机制有较弱的平移不变性;(2)分类模块与定位模块相对独立。第一个问题会导致同一个尺寸较小的目标在图像中不同位置的检测结果会有较大差异,因此本文提出对小目标预测的特征图进行循环移位的方式减小网络对小目标所处位置的敏感程度。分类模块与定位模块欠耦合的问题会导致检测结果中分类置信度最高的检测框,其位置精度不是最准的,因此本文提出交并比预测模块和平滑非极大抑制后处理方法。交并比预测模块对检测框结果的定位精度进行预测,并将预测得到的结果与分类置信度结合,作为检测结果的可信度。平滑非极大抑制方法将置信度较低但定位精度较准的检测框结果与置信度最高的检测框结果进行位置平均,提高置信度最高的检测框的定位精度。最后本文将提出的小目标敏感的实时一阶段检测方法拓展到视频中的目标检测任务,提出使用假设轨迹对未来目标可能出现的位置进行预测,并选择性地降低该区域的正例判定置信度阈值。基于深度学习的目标检测方法可解释性较差,本文根据确定的几何约束关系提出应用于深度网络的几何约束损失函数与几何约束抑制方法。自动驾驶等应用场景中相机的安装姿态相对固定,因此目标的成像规律也相对不变。本文以自动驾驶中的行人检测为例,利用透视投影法则推导出图像中行人边界盒的高度与位置的关系式,并总结出几何约束定理。同时基于几何约束定理,设计应用于深度网络训练阶段的几何约束损失函数和推理阶段的几何约束抑制方法。几何约束损失函数对不满足几何约束定理的样本的损失进行衰减,而几何约束抑制则对不满足几何约束定理的检测框对应置信度进行衰减。将两个几何约束方法应用于一阶段和两阶段目标检测方法,在主流数据库上均取得了较好的目标检测效果。