论文部分内容阅读
眼睛为人类提供了感知外界事物最主要和最直接的视觉能力,其有效传递了重要的身份和状态信息。人眼检测即在图像中确定人眼的存在性、位置和尺度等。人眼检测作为模式识别中的一个分支,具有重要的研究意义和应用价值。传统人眼检测算法由于精度低且鲁棒性差,已经无法适应如今复杂场景下的应用需求。因此,本文着重研究了基于深度学习的复杂场景下人眼检测算法,并将其应用到人眼身份识别和疲劳驾驶检测研究之中。所做具体工作如下:(1)以传统Adaboost方法作为人眼检测研究的出发点,分析了影响基于Adaboost级联分类器的人眼检测性能的因素即正负样本集选取规则和不同的特征模板,并通过对比实验总结最佳人眼检测模型训练方案。依据传统检测模型在复杂场景下的实际表现论证了其应对目前的人眼检测还存在不足之处,进而引出基于深度学习方法的人眼检测研究方案。(2)提出了基于改进YOLOv3的人眼检测算法。针对复杂场景下传统人眼检测方法的局限性,提出了一种不依赖于人脸检测的直接人眼检测算法,解决了复杂场景下多尺度尤其是小尺度人眼检测问题。该算法通过减少骨干网络中下采样因子并且加入了扩张残差单元以提升小尺度人眼的检测能力,对多尺度特征相互拼接以保证多尺度人眼检测的精度,并且依据通道剪枝的方式压缩网络输出通道来降低模型复杂度以提升人眼检测效率。实验表明,人眼检测精度m AP为82.59%,尤其是小尺度人眼(约120像素)的检出率没有明显降低,算法检测效率为30.5FPS。另外还就所提人眼检测方法在红外人脸图像上的适用性进行实验,红外人眼检测精度m AP为93.15%,检测效率为31.2FPS。(3)研究了人眼检测算法在人眼身份识别和疲劳驾驶检测中的应用。研究了人眼身份识别应用框架。以改进人眼检测算法输出作为识别网络的输入,采用Resnet提取人眼特征,最终输出为人眼类别和识别率,实验证明人眼识别率达到98.85%。提出了一种基于人眼特征分析的疲劳驾驶检测方法。针对疲劳驾驶检测易受光线干扰、局部面部遮挡以及姿态变化等因素的影响,该算法以Dense Block关键点定位网络实现精确的人眼关键点定位,根据眼睛关键点对计算眼睛横纵比(EAR,Eyes Aspect Ratio)并由统计方法确定EAR阈值,由此阈值在时域上分析睁眼和闭眼状态,结合PERCLOS准则判断驾驶员的疲劳状态。实验验证了EAR阈值选取的有效性、基于PERCLOS准则判断疲劳状态的合理性以及算法实际应用的精确性。