论文部分内容阅读
驾驶中的分神行为具有频发性和短暂性,易引发道路安全事故。监测驾驶端并及时预警是降低碰撞风险的有效手段。本文选取能反映行驶状态的头部姿势为研究主体,利用深度学习理论与方法实现驾驶员分神状态的识别,主要研究内容如下:首先,提出了一种基于深度学习的头部姿势估计方法。针对实际图像采集过程中存在的光源复杂、明暗变化大以及车辆颠簸震动等不利因素,在实验前增强训练集模拟真实驾驶场景。通过下采样、高斯模糊和边界增强滤波等操作并在过程中引入随机性,迫使模型学习不同成像质量的图片,降低模型对高清图像的依赖度。根据单一回归与分类结合回归两种设计思路改进AlexNet和ResNet,给出5种不同深度的卷积网络。在分类结合回归思路中,对欧拉角进行解耦训练,设置对应的复合损失函数并使用迁移学习的训练策略,最后在各模型上同时验证两种思路的精确性。实验表明,分类结合回归思路的效果更为突出,本文的最优模型HPE101可在数据集AFLW2000上取得5.61°的平均绝对误差,在数据集AFW上取得79.2%(±3°)和92.3%(±5°)的平均查准率,并有一定的抗干扰能力,可胜任模糊环境下的头部姿势估计任务。其次,进行头部框体标注和差异性分析。与公共数据集不同,现实中的驾驶员图像上无任何注释信息,为能更精确地分析头部姿势与分神驾驶间的关系,本文选用深度学习模型RetinaFace进行人脸位置检测,后续通过扩充系数放大边界框,提高头部占比。完成标注后使用模型HPE101计算得出10分类公共分神驾驶数据集SF3D(State Farm Distracted Driver Detection)中各张图片的欧拉角,从定性定量两个角度讨论类间差异。定量角度中的方差分析表明在置信水平95%和90%条件下,安全驾驶与各类分神驾驶在头部姿势上存在统计学意义上的显著差异,且各类驾驶动作的姿势分布在特定的欧拉角区间,为后续识别方法设计提供了特征依据。最后,提出了一种基于连续视频帧欧拉角的分神识别方法。单帧图像无法表达一段时间内的连续信息,以此判别分神状态存在较大的偶然性,因此方法从驾驶端视频入手可完整表达驾驶中的各类头部动作,以分神驾驶理论为依据设置3类分神参数,通过计算欧式距离完成降维,并根据当前成像角度统计得出对应的安全驾驶头部范围与分神阈值。实验表明通过计算待测视频帧的分神参数可清晰地分辨驾驶状态,且对驾驶员观察两侧后视镜的正常驾驶操作有良好的过滤性。该论文有图38幅,表23个,参考文献76篇。