基于深度学习的驾驶员行为识别方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:snsjgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
驾驶员行为的识别对于交通安全而言具有重要的现实意义。研究表明,75%的交通事故都是由于违规的驾驶行为引起的,如果可以通过提前识别分析驾驶员行为并进行预警,规范驾驶行为,就可以避免大部分交通事故的发生。随着人工智能、机器学习的发展,车辆也得到了智能化发展,因此产生了智能车辆,智能车辆因其重要使用价值成为了目前研究的热门话题。智能驾驶在实际应用时仍存在很多亟待解决的问题,如行车过程对驾驶员行为的感知不及时,这样的问题会导致行车过程产生危险。因此,这类驾驶的安全问题需要得到重视。影响智能驾驶的因素有驾驶员,智能车,道路情况,行人情况;本文中,我们针对智能驾驶中的驾驶员这一要素开展驾驶员行为识别的研究。为了更好地识别驾驶员的行为,通过智能车内安装的摄像头获取驾驶员的相关数据,使用计算机视觉技术和机器学习方法对实验数据进行分析,通过最终得到的识别结果对驾驶员进行相应的提醒。在驾驶员行为中,本文针对驾驶员的手势行为和驾驶员头部行为两种行为进行分析,以此作为本文的研究核心。随着智能驾驶实际应用场景的变化,数据集的数据量和计算量都在增加,相应的使用环境也不再是单一场景,基于传统的识别算法已经不能满足现在的智能驾驶需求。因此,本文中选择使用基于深度学习的行为识别算法。与传统的识别算法相比,这类方法已经在行为识别上取得了良好的效果,在识别的准确率和速度上都进行了提升,但这类方法在面对智能驾驶应用场景时仍存在一些问题需要解决。这些问题包括行车数据的稳定性,数据采集的环境影响等,这些问题的存在会直接影响最终识别的准确率。为了更好地解决这些问题,我们针对驾驶员手势行为和头部行为进行了相关研究。本文的具体工作如下:首先,在驾驶员手势识别的问题上,针对VIVA Challenge Dataset手势数据集中存在噪点的问题,提出了一种基于卷积与反卷积结合的去噪方法,这一方法减少了原始数据集中的噪点。在考虑到数据集中同时包含RGB图像和深度图像的前提下,提出将深度图像与RGB图像的视频帧进行逐帧交错的方案,并通过将残差思想与3D卷积神经网络(3D Convolutional Neural Networks,3DCNN)相结合进行训练,实现对驾驶员手势数据的分类与识别。最终的实验结果表明,这种模型和去噪方法在处理手势数据分类问题上有一定的优势,同时论证了交错帧的信息有效性。其次,针对Kaggle数据集中包含RGB图像和深度图的特点,将深度图与RGB图像相结合,充分利用两种模态提供的丰富信息,提出了一种多模式特征融合的驾驶员手势识别方法。为了更好地利用深度手势视频中的有效信息,我们设计了一种改进的基于权重的帧选取方法以从给定视频中选取更具代表性的帧。此外,为了更好地将信息进行最大化地利用,通过Res Next网络提取特征,然后将特征嵌入分支(Feature Embedding Branch,FEB)方法用于静态数据,将静态数据包含的信息进行更大程度地利用。之后,将处理后的静态数据特征和动态数据特征通过DCA(Discriminant Correlation Analysis)方法集成在一起,将各方信息进行融合,并使用线性SVM(Support Vector Machine)分类器进行分类。通过实验发现,这一方法的分类准确率为98.35%,优于当前对比方法,因此适用于智能汽车界面中的手势识别。最后,针对驾驶员头部行为的识别,提出了一种基于Yolov4和注意力机制的驾驶员头部行为的分类方法。首先,我们使用Yolov4对驾驶员上半身数据集进行训练,以快速、准确地提取驾驶员头部的图像。然后,使用Resize方法将所有头部图像重塑为相同大小。之后,为了更精准地识别驾驶员头部行为,将数据集进行重分类,使其所包含的类别更丰富。此外,为了提取更具判别性的特征,提出了一种包含全局注意力的注意力机制(由主干(trunk)和掩码(mask)分支组成),同时在TSE-mask(Transformed SE-mask)分支中使用改进后的SE注意力块来获取其他关键特征。实验结果表明,该方法可以达到83.26%的分类准确率,实验表明该方法优于其他对比方法,因此适用于驾驶员头部行为识别的应PULSE(Photo Upsampling via Latent Space Exploration)方法用场景。另一方面,由于驾驶员上半身数据集存在类间不平衡的问题,因此需要充分利用数据集中的原始图像,使用将对焦失败图像进行还原,可以充分利用数据集的原始图像。然后在Res Ne St算法中引入自矫正卷积,以此保证在参数量基本不变的情况下获得更好地分类效果。实验结果表明,与其他对比方法相比,这一方法可以更快更好地识别并判断驾驶员状态。本文通过解决驾驶员手势行为和驾驶员头部行为的分类和识别问题,希望能够在一定程度上保证驾驶员在智能驾驶过程中的安全性,为智能驾驶的实际应用场景提供更多的解决方案。
其他文献
荧光传感器因其具有使用简单、响应快、高选择性和高灵敏度等优点,可提供定性和定量信息,而被广泛地应用在众多研究领域。荧光传感器的核心是荧光探针,随着近几年来纳米材料荧光探针和有机小分子荧光探针的快速发展,荧光探针已成为不同类型分析物检测中的有力工具。但荧光探针在发展的过程中仍有许多问题尚未解决,如:碳点(CDs)的形成过程和荧光机理还存在争议;异原子掺杂及溶剂调控碳点的合成策略;碳点作为多用途传感器
商业特许经营的起点是被特许人为取得特许人的特许经营权支付费用,并围绕特许经营权的行使订立特许经营合同,商业特许经营权这一概念常出现于对商业特许经营的相关研究中。然而,究竟何为特许经营权、权利主体是谁、具体包含哪些内容、权利行使方式是否存在限制、授权行为是否具有限制、如何进行权利保护等具体问题却少有人回答。现有针对特许经营的研究大多将视线集中于特许经营中其他更为具体的问题上,对于特许经营权的分析往往
近年来,随着互联网和信息技术的快速发展,日常便捷的生活环境中离不开个人身份识别系统。利用人体固有的生物特征实现身份识别具有更高的可靠性,因此被学者广泛研究。心电信号是记录心脏起搏的电活动过程,包含丰富的身份信息并且满足身份识别的基本特性。与现有的生物特征相比,利用心电信号(ECG,Electrocardiograph)进行身份识别的主要优势为:ECG信号是通过活体测量,难以伪造;信号不会受外界影响
"十四五"期间,光伏、风电装机比重将进一步提升,电力系统对储能电站容量的需求也将随之增加。考虑到未来几年国家政策对储能产业的扶持、产业链的发展完善、产品的研发改进以及产品制造成本降低等利好因素的影响,储能产业的发展有望进一步提速。为降低弃光弃风率,提高可再生能源发电项目整体经济性,针对光伏电站和风电场如何确定储能装机容量以及如何确定储能系统充放电功率提出了基于经济性最优的储能系统优化配置方法。该方
职业教育专业课教材是成千上万学生频繁使用的学习资源。教材的结构化问题初看微小,实则重大。教材如何成为逻辑明确且清晰的符号构合体,不仅影响教材建设质量,而且制约课程改革和教育改革能否突破瓶颈。2017年以来我国成立国家教材委员会,组建教育部教材局,专门单独设立职业教育国家重点教材研究基地等系列战略措施;国务院政策文件明确提出开发“新型活页式”和“手册式”职业教育专业课教材来强化组织模式和内容结构改革
定位信号参量估计是阵列信号处理领域的重要研究内容之一,在雷达、声呐、移动通信、遥感勘探等领域有着重要的应用价值。理想模型假设下的定位信号参量估计理论已经发展到较高水平,然而实际工程应用中阵列接收信源信息的过程往往面临阵列的非完全校准、传播介质非均匀和传播环境温湿度变化等因素影响,这些非理想的阵列接收模型破坏了接收数据阵列流形的精确无偏条件,造成了阵列接收信号在幅度和相位上的扰动。研究表明,当幅相误
学位
NiCrBSi系合金的主要成分一般包括Ni、Cr、B、Si、Fe、C等,因其在常温及高温下均具有良好的硬度、耐磨及耐腐蚀性能,因此被广泛地应用于零部件表面耐磨及耐腐蚀涂层的制备。NiCrBSi系合金中比较具有代表性的为Ni60合金(Cr16.0 wt.%,B3.2 wt.%,Si 4.0 wt.%,Fe<15.0 wt.%,C 0.8 wt.%,Ni Bal.),使用Ni60合金制备的涂层硬度可以
对公路工程造价成本控制问题展开论述,提出强化造价成本控制的策略。首先概述了公路工程造价成本控制面临的挑战,其次结合实例分析了公路工程造价成本控制方法,最后总结了造价成本控制的经验。从管控实践的效果分析,引入信息化技术和现代化理念,辅助公路工程管理工作的开展和落实,可起到提高管理水平的作用,具有推广应用价值。
学位