基于卷积神经网络的多尺度行人实时检测

来源 :江南大学 | 被引量 : 0次 | 上传用户:shmi1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智能视频监控、车辆辅助驾驶和人体行为分析等领域的广泛应用,行人检测技术已经成为了计算机视觉重要的研究课题。传统的检测方法虽然能够满足速度要求,但精度相差较远,基于卷积神经网络的方法精度较高,但检测速度慢。本文针对基于卷积神经网络的行人检测方法中出现的问题进行研究,在前人的基础上,从行人检测的多尺度、多遮挡以及实时性三个方面提出改进方法。本文主要的研究成果可分为以下三个方面:(1)针对车辆辅助驾驶系统在拍摄过程中行人不同的长宽比造成的多尺度问题,本文提出一种基于改进全卷积网络的多尺度感知行人检测方法。首先,通过在全卷积网络结构中引进可形变卷积层,扩大特征图的感受野;其次,通过级联RPN提取多尺度行人建议区域,引入多尺度判别策略,定义尺度判别层,判别行人建议区域的尺度类别;最后构建一个多尺度感知网络,引进Soft-NMS检测算法,融合每个网络输出的分类值和回归值,获取最终的行人检测结果。实验可得,本文的检测算法在基准数据集Caltech和ETH上产生较低的检测误差,优于当前数据集中所有检测算法的精度,并适用于检测远尺度的行人。(2)本文在研究多尺度行人检测的基础上,针对算法检测多遮挡行人精度低和速度慢的问题,提出了一种基于改进R-FCN的多遮挡行人实时检测算法。在R-FCN网络基础上,引进感兴趣区域(RoI)对齐层,解决特征图与原始图像上的RoI不对准问题;改进可分离卷积层,降低R-FCN的位置敏感分数图维度,提高检测速度。针对行人多遮挡问题,提出多尺度上下文算法,自适应输出不同尺度的行人RoIs;针对遮挡部位可见度低,提出可形变RoI池化层,扩大对身体部位的池化面积。为了减少视频序列中行人的冗余信息,使用序列非极大值抑制算法代替传统的非极大值抑制算法。检测算法在基准数据集Caltech训练检测和ETH上产生较低的检测误差,适用于检测多遮挡的行人。(3)针对检测模型参数量过大,算法在嵌入式系统无法达到实时检测的问题,提出了一种基于通道裁剪的方法实现模型压缩加速的方法。首先,使用通道选择和特征图重构的方式来最小化输出特征图的重构误差。然后,为了提高中间层通道的参数判别力,引进判别感知损失函数,自适应地移除中间层中不重要的参数,减少模型的冗余度。最后采用“训练-裁剪-微调”的三段式加速方法在尽量保证检测精度的同时降低总的测试时间。本文通过比较裁剪比例和算法的运算时间,在保证不损失检测精度的前提下,缩小了训练模型的参数量,将算法应用到嵌入式系统中,达到了实时检测速度。
其他文献
1947年7月至9月,全国土地会议在河北省的平山县西柏坡召开。这是我们党历史上有关土地问题的一次最重要会议,是我国土地改革运动史上的一座里程碑。会议通过的《中国土地法大
采用小梁弯曲蠕变试验所获得的SMA-13玄武岩纤维高粘沥青混合料广义Maxwell模型粘弹性参数;依托实际工程,建立有限元模型进行周期荷载作用下的铺装层粘弹性力学分析。结果表
目的了解食盐中碘浓度调整后济南市孕妇及哺乳期妇女碘营养状况。方法通过随机抽样方法,在城区郊县按照东、西、南、北、中划5个抽样片区,每个片区随机抽取1个乡镇,每个乡镇
期刊
<正>戴锦成教授是我省名老中医,在40多年从医从教中积累不少经验,对中医治疗男性病深有造诣,其治法标新立异,对各种男性病疗效卓著,现将其临诊验案3则介绍如下,以飧读者。
河北省饮用天然矿泉水资源广布,储量丰富。依据中华人民共和国标准(GB8537-87)饮用天然矿泉水指标要求,截止1994年底经省级、国家级评审或批准的饮用天然矿泉水158处,有H_2SiO_3.Sr型,H_2SiO_3型,Sr型,I·Sr型,Br·Sr·H_2SiO_3型及Li·I·Sr·H_2SiO_3型
目前我国东、中、西部地区的经济发展存在较大差距,其中重要原因之一是对外开放的差距。选取我国欠发达地区12个省区近30年的面板数据,通过对欠发达地区的对外贸易及吸引外商
装配式建筑要实现走工业化道路,亟需为实现装配式建筑在全产业链的信息共享和传递,数据融汇贯通,建立行业或企业统一的、全产业链共享的、基于建筑信息模型的部品库。
为了探明化学诱变剂EMS对高粱种子的诱变处理效果,进行了不同EMS浓度、不同EMS处理时间对R111种子发芽率和成苗率影响的试验,并在适宜浓度和处理时间下,比较了6种基因型的发