基于双线性注意力网络的分心驾驶图像分类算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:you19841231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车行业蓬勃发展,出行面临的交通压力也愈来愈大,交通安全成为了人们关注的重点。分心驾驶是导致交通事故的重要原因,分心驾驶行为的检测已经成为图像分类领域中比较热门的研究方向。分心驾驶行为存在整体动态性不明显、动作变化幅度和动作空间较小的特点。如何在车内场景下,准确高效检测出分心驾驶行为已然成为分心驾驶图像检测的重点。目前分心驾驶图像分类大多采用传统CV算法或者深度学习方法,但是这些方法均存在以下问题:(1)传统的基于计算机视觉研究方法对环境的要求较高,运用范围比较窄,参数多运算量大,计算方法复杂。(2)现有的针对分心驾驶图像分类模型的泛化能力不理想,难样本问题未能良好解决,总会有一小部分图像由于类别特征不明显从而导致错误分类。(3)由于驾驶图像背景环境单一,图像中大部分区域都存在无效信息,造成不相关的图像信息冗余,对分类准确度造成较差影响。对于上文描述的各种未解决的问题,本文以公开的分心驾驶数据集为研究对象,融合使用双线性池化模型、难样本处理方法和改进的双路注意力机制对其进行信息挖掘,提高分类准确度。本文工作如下所示:(1)针对现有的分心驾驶分类模型参数多,运算量大,计算方法复杂等特点,构建新的紧凑双线性卷积神经网络,使网络能够提取具有分心驾驶行为特异性特征的同时,有效地避免了成本高,运算量和存储量大,以及梯度消失的问题。本文提出的紧凑双线性池化模型有效地解决了分心驾驶图像分类错误的问题。(2)针对分心驾驶图像分类模型在训练中总有一些图片分类错误的问题,本文进行了难样本挖掘,提出了多重损失网络结构,使模型在训练时更专注难分类样本。(3)针对分心驾驶图像信息冗余,特异性不明显,分类准确性差等问题,提出了双路注意力机制的卷积神经网络,有效排除无用特征,减少冗余。本文的实验采用公开数据集State Farm Distracted Driver Detection进行分心驾驶图像识别模型的性能分析。使用了混淆矩阵作为评估准则,结果表明本文提出的双线性神经网络算法的准确率更高,证明了本文给出的双线性注意力网络模型有着更好的图像分类效果。
其他文献
传感技术的迅猛发展使得图像成像系统逐渐完善,得到的图像信息呈爆炸式增长。这些信息之间既有互补性,又存在较大的冗余性。图像融合技术可以将多幅图像由不同类型传感器或同一类型传感器的互补信息融合至一幅图像上,并在消除冗余信息后,生成一幅新的图像。融合后的图像能够弥补单一图像的不足,并且可以提高图像信息的利用率,获得更加丰富且精确的信息,同时借助获取的信息来生成高质量的图像。图像融合技术已经被广泛地应用在
在我国,现如今胃癌已经成为第三大癌症,并且每年都会有40万人左右深受胃癌所带来的伤害。目前,在临床上对胃癌进行诊断的常用手段之一就是内窥镜检查。胃癌在发病时较为隐匿、不易被患者所察觉,早期经常会因为没有明显的症状而导致漏诊的情况出现,并且还具备易转移、复发和预后差等特点。据研究表明,内窥镜检查可以显著的减少亚洲患者胃癌死亡率。在检查过程中产生的大量内窥镜图片需要由专业的内科医务人员去进行初步筛选,
智能问答是指计算机通过分析用户提问,自动回答用户所提出的问题,是一种高级形式的信息服务。知识图谱本质上是一种围绕特定实体所构成的语义关系网络,由实体、概念以及它们之间的关系组成。将知识图谱拥有的丰富且庞大的现实世界知识注入智能问答模型中,将使智能问答模型的表示能力进一步提升,进而在面向事实型问答任务时,无论是用户意图的识别,还是问答中实体的识别都将更为符合现实世界的常识,从而从基础上提升智能问答系
小规模学校是乡村教育的薄弱环节,其中师资是短板。美国、印度、英国、法国、日本、韩国等均存在大量小规模学校,也曾面临师资困境。为了加强小规模学校的教师队伍建设,这些国家在保障教师数量、提高教师地位、促进教师发展等方面进行了有益探索,如按照工作量核定教师编制,提高教师综合待遇,建立教师发展共同体等,对我国乡村小规模学校教师队伍建设具有重要启示。
目的:探讨二步截骨联合生物型长柄假体植入治疗老年粗隆间骨折的疗效。资料与方法:回顾性分析2013年1月至2020年6月我院关节外科收治的74例老年粗隆间骨折患者。男性15例,女性59例,年龄67~98岁,平均年龄81.91±6.88岁。根据Evans-Jensen分类,I型1例,II型27例,III型12例,IV型25例,V型9例。47例(骨水泥组)使用骨水泥型半髋假体植入,27例(生物组)使用生
目的:肺癌是全球癌症相关死亡的主要原因,非小细胞肺癌约占肺癌病例的85%,许多非小细胞肺癌早期表现为磨玻璃结节(ground-glass nodule,GGN),20%-30%的GGN患者有一个以上的病灶。目前对导致单发和多发GGN的研究主要集中在治疗方案和基因水平的差异,二者病灶数量不同的机制尚不清楚,单发和多发GGN患者的血液学指标差异也未见报道。因为GGN病情进展或因为阅片过程中病灶不清楚而
近年来,汽车保有量逐年增加,寻找空闲停车位愈发困难,“停车难”问题日益严重。因此,在停车位数量无法大量增加的情况下,如何有效利用停车位资源成为目前研究的焦点。本文依托于吉林省科技厅重点科技研发项目“基于车联网的城市停车位智能服务平台的构建”,以校园为试点,在校园中模拟城市的情况。设计并开发校园智能停车系统,力图实现停车场的智能化。本系统采用热点技术与理念,将现有停车场智能化。首先,采用轻量级的Fl
在目前的工程应用与基础科学研究中,许多亟待解决的问题都可以被转变成求解最优化的过程。虽然传统的优化技术可以解决这些问题,但当问题变得更复杂更具挑战性时,它们便很难找到全局最优解。近几年来,随着计算机科学的发展,许多过去人类无法解决的复杂函数优化问题已经可以通过计算机来得到近似解。在求解过程中,人们创造了许多优秀实用的算法。元启发式算法作为一种随机优化策略,因为其能很好地解决复杂优化问题,所以它已成
中国互联网络信息中心2020年4月的报告中显示,我国上网的群众人数已超过9亿,互联网络的普及率也达到了60%以上。这一数据一方面说明了人民生活变得更加信息化,但另一方面也提醒我们的社会正在面临着一次前所未有的挑战,如何处理好海量网络文本信息成为了一个迫切需要解决的问题。如何使用自然语言处理技术(Natural Language Processing)分析海量的网络评论文本成为了研究人员的研究热点。
在计算机图像处理问题中,图像超分辨率(Super-Resolution,SR)采用数学模型计算的方式在尽可能保留图片原有纹理细节的情况下,将低分辨率(LowResolution,LR)图像转换成高分辨率(High-Resolution,HR)图像。研究表明,基于深度学习图像超分辨率方法的性能会随着网络宽度和层数的增多而提高,然而这些算法仍然面临一系列问题:1.单纯增加神经网络的深度或宽度会带来梯度