【摘 要】
:
人手作为人类传递信息的重要媒介之一,在计算机视觉领域得到了广泛的研究。在智能汽车场景中,车内人手检测不仅是车载人机交互的基础,还是分析驾驶员行为、研究车辆驾驶安全的基础。为此,本文研究了基于深度学习的车内人手检测算法。综合评估算法的精度和速度,本文基于高效且快速的单阶段目标检测网络YOLOv2提出了Multi-Scale YOLOv2人手检测算法。该算法主要通过三个模块来提升YOLOv2的人手检测
论文部分内容阅读
人手作为人类传递信息的重要媒介之一,在计算机视觉领域得到了广泛的研究。在智能汽车场景中,车内人手检测不仅是车载人机交互的基础,还是分析驾驶员行为、研究车辆驾驶安全的基础。为此,本文研究了基于深度学习的车内人手检测算法。综合评估算法的精度和速度,本文基于高效且快速的单阶段目标检测网络YOLOv2提出了Multi-Scale YOLOv2人手检测算法。该算法主要通过三个模块来提升YOLOv2的人手检测性能:1、多尺度特征提炼模块,用来获得更加精细化的特征,提升网络对低分辨率人手的检测性能;2、通道重要性评估模块,用来自动学习特征通道的重要性并重新分配通道权重,增强特征的表现能力;3、难例惩罚模块,通过在损失函数中增加一项难例损失项来增强网络的判别能力,减少误检。针对基于单阶段目标检测网络的人手检测算法精度不够高的问题,本文将两阶段目标检测网络Faster R-CNN应用于人手检测。我们使用ResNet101作为基础特征提取网络,以提取表现力更好的特征。用可对齐的感兴趣区域池化(ROI Align)代替原始的感兴趣区域池化(ROI Pooling),以解决目标候选框的位置和大小与目标不匹配的问题,从而提升人手检测的精度。针对人手形变的问题,我们在网络中引入可变形卷积,以增强网络对形变的建模能力,提升人手检测性能。针对基于两阶段目标检测网络的人手检测算法速度慢,模型大的问题,本文提出基于知识蒸馏的Thin Faster R-CNN人手检测算法,该算法首先将Faster R-CNN的特征提取网络ResNet101的特征通道数减少为原来的1/4,得到了Thin Faster RCNN网络,然后再采用知识蒸馏来训练Thin Faster R-CNN。其中知识蒸馏包括基于注意力的特征图知识蒸馏和分类知识蒸馏两部分。基于注意力的特征图知识蒸馏诱导学生网络学到与教师网络相似的特征表示,分类知识蒸馏让学生网络学到更加强大的分类器。实验表明,通过减少特征通道数所得到的Thin Faster R-CNN网络在GPU上能达到实时的人手检测速度。经过知识蒸馏训练后,Thin Faster R-CNN人手检测精度得到了大幅提升。本文从算法精度、速度两方面展开研究,大幅提升了车内场景中人手检测效率,在车载交互系统应用和车辆驾驶安全研究方面,有着重要的推动意义。
其他文献
多目标显著性检测,是一个能够从图像中自动检测出两个或者两个以上的显著性物体的计算机视觉处理过程,但因为目标大小不定,位置各异,数目不同,色彩多样,是显著性检测领域新的挑战。超像素分割常用来对图像进行预处理,以提升算法整体性能,本文首先基于“梯度下降”的方式对超像素分割算法进行了研究,随后重点研究了基于超像素分割和“自底向上”思想的面向单幅图像中多个目标的显著性检测算法设计及其应用,主要工作与创新点
全场光学血管造影是一种新兴的血管成像方法,具有较高的时空分辨率,适合应用于在体的实时成像,具有很好的临床应用前景,已被广泛应用于视网膜、斑马鱼和老鼠耳朵中的血管成像
随着位置服务的日益发展,人们对于位置服务的需求也从室外扩展到了室内,但是由于墙壁对电磁信号的削减,室外定位系统难以满足人们在室内对定位系统精度的要求。精确的室内定
无线可充电传感器网络(Wireless rechargeable sensor networks,WRSNs)中,节点部署直接关系到网络监测是否有盲区以及网络成本。WRSNs节点部署不同于传统的无线传感器网络,因
近年来,神经网络已经在目标跟踪、语音检测识别、无人驾驶和抗击疫情等领域展现出卓越的性能。卷积神经网络(Convolutional Neural Networks,CNN)是其中应用最为广泛的神经网
近年来,各类医疗纠纷逐渐增多,伤害医务人员的恶性暴力事件频繁发生,此类暴力案件呈“井喷式”爆发,屡禁不止,对和谐社会的构建产生了巨大的危害,如何有效化解医疗纠纷已成为
随着市场需要日益增长和行业标准逐渐提高,人们对MEMS压阻式压力传感器的性能要求也水涨船高。传统的压阻式压力传感器存在精度较低、温漂较高、灵敏度偏低以及易受到风速效
物联网应用广泛,且往往节点众多,无人值守,面临着严峻的信息安全风险;其感知层节点具有计算能力弱、能耗低和存储空间不足等特点,现有的入侵检测方法难以适应资源受限且不断
具有编码和解码结构的卷积神经网络在语义分割任务中表现出强大的表征能力,并在显著性检测领域得到了广泛应用。在大多数情况下,利用Image Net数据集上预先训练过骨干网的参
自动调制信号识别(Automatic Modulation Recognition,AMR)是解调前的一个复杂且重要的技术,它在电子侦察、电子对抗等军事领域和无线电频谱管理等民用领域都有广泛的应用。