论文部分内容阅读
通过Caltech数据集训练区域候选网络时,发现其在场景复杂情况下存在大量的漏检和误检。经分析:一是区域候选网络使用VGG网络提取待检测图片特征,由于VGG网络层数较少,提取的特征不能够很好地表达行人;二是锚边框的尺度通过手工设计,没有利用到行人的尺度先验信息。针对以上2个问题,提出了一种改进的区域候选网络的行人检测方法,首先通过使用分类能力更强的Res Net提取待检测图片特征,然后利用检测小网络在卷积特征图上滑动,预测多个锚边框区域是否是行人并对锚边框位置和尺度进行修正,其中锚边框尺度通过KMe