基于深度学习的驾驶员分神状态识别方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:scg5252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
驾驶中的分神行为具有频发性和短暂性,易引发道路安全事故。监测驾驶端并及时预警是降低碰撞风险的有效手段。本文选取能反映行驶状态的头部姿势为研究主体,利用深度学习理论与方法实现驾驶员分神状态的识别,主要研究内容如下:首先,提出了一种基于深度学习的头部姿势估计方法。针对实际图像采集过程中存在的光源复杂、明暗变化大以及车辆颠簸震动等不利因素,在实验前增强训练集模拟真实驾驶场景。通过下采样、高斯模糊和边界增强滤波等操作并在过程中引入随机性,迫使模型学习不同成像质量的图片,降低模型对高清图像的依赖度。根据单一回归与分类结合回归两种设计思路改进AlexNet和ResNet,给出5种不同深度的卷积网络。在分类结合回归思路中,对欧拉角进行解耦训练,设置对应的复合损失函数并使用迁移学习的训练策略,最后在各模型上同时验证两种思路的精确性。实验表明,分类结合回归思路的效果更为突出,本文的最优模型HPE101可在数据集AFLW2000上取得5.61°的平均绝对误差,在数据集AFW上取得79.2%(±3°)和92.3%(±5°)的平均查准率,并有一定的抗干扰能力,可胜任模糊环境下的头部姿势估计任务。其次,进行头部框体标注和差异性分析。与公共数据集不同,现实中的驾驶员图像上无任何注释信息,为能更精确地分析头部姿势与分神驾驶间的关系,本文选用深度学习模型RetinaFace进行人脸位置检测,后续通过扩充系数放大边界框,提高头部占比。完成标注后使用模型HPE101计算得出10分类公共分神驾驶数据集SF3D(State Farm Distracted Driver Detection)中各张图片的欧拉角,从定性定量两个角度讨论类间差异。定量角度中的方差分析表明在置信水平95%和90%条件下,安全驾驶与各类分神驾驶在头部姿势上存在统计学意义上的显著差异,且各类驾驶动作的姿势分布在特定的欧拉角区间,为后续识别方法设计提供了特征依据。最后,提出了一种基于连续视频帧欧拉角的分神识别方法。单帧图像无法表达一段时间内的连续信息,以此判别分神状态存在较大的偶然性,因此方法从驾驶端视频入手可完整表达驾驶中的各类头部动作,以分神驾驶理论为依据设置3类分神参数,通过计算欧式距离完成降维,并根据当前成像角度统计得出对应的安全驾驶头部范围与分神阈值。实验表明通过计算待测视频帧的分神参数可清晰地分辨驾驶状态,且对驾驶员观察两侧后视镜的正常驾驶操作有良好的过滤性。该论文有图38幅,表23个,参考文献76篇。
其他文献
激光加工作为20世纪新兴的一种加工技术因其加工速度快、热变形及热影响区小、加工成本低等特点被广泛应用于各行各业,相对于传统的机械加工其可以有效的减小热影响区从而提
桥梁监测系统可以有效保障服役桥梁的安全性和耐久性。由于器件老化、环境、噪声的影响,部分传感器存在零漂、抖动等数据偏差;另一方面大跨度桥梁的监测传感器众多,长时间监
近年来重金属污染事件频发,严重威胁着人类和动植物的生存安全。重金属污染与防治己经成为人们迫切关注的环境领域。目前,治理重金属的方法主要有:电化学法、沉淀法、离子交
传统的经典评价方式是以单一的分数为主,不能获得隐藏在量化结果背后丰富的诊断信息,忽略了学生的综合素质和个性发展。而新一轮的课程改革强调要培养学生的学科核心素养,这
无迹卡尔曼滤波器是针对含有噪声和干扰的情况下用于状态估计的最优观测器.它不仅广泛用于整数阶系统的状态估计,而且也广泛用于估计分数阶系统的状态信息.无迹卡尔曼滤波器
设备到设备通信(Device-to-Device,D2D)是一种用户间不需要经过基站转发数据的直接通信技术。在传统蜂窝网络中引入D2D通信,不仅可以提升系统的频谱利用率和吞吐量,还可以降
现阶段我国经济发展迅速,城镇化发展趋势显著。城市可以同时举办大量的赛事,也需要通过赛事来展示城市这张靓丽的名片,需要通过举办大量的赛事来满足城市需求。城市举办的赛
碳纤维(CF)具有模量高、耐腐蚀、抗蠕变、导电等一系列优异的性能,在航天航空、能源、交通等领域都有着举足轻重的地位。但由于其表面呈化学惰性,与树脂基体的界面粘接性能较
航空重力测量系统是以动态平台为载体,通过惯性器件的输出来确定某一地区重力场的设备,航空重力测量比传统重力测量的速度更快,范围更广,成本更低,而且没有空间限制,为构建重
数据VV&C是保证数据质量,提高数据可信性的重要方法。一致性作为其中的一个公认关键指标,用于评估和衡量一个或多个数据集中信息的一致化程度。地形数据是建模与仿真中的一类