基于深度学习的车载场景手势识别研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:lzwxy105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种直观自然的交互方式,手势日渐从人际日常交流向新型人机交互发展,尤其是在车载控制系统上,不少高端车型已将手势识别技术应用于搭载的车载影音娱乐系统。在众多技术实现路线中,基于单目彩色摄像头的机器视觉方案因为所需的传感器简单便宜,越来越被研究者们所注意。为解决手势图片背景复杂、自遮挡、易形变等识别困难,本文利用深度学习技术提高其识别准确率。为了解决上述问题,本文设计了基于单目彩图的深度学习手势识别解决方案。该方案由以下三部分构成:首先是针对车载场景复杂背景下的手势分割算法。对于现有的手势分割方法在复杂背景下难以从图像中准确地分割出静态手势的问题,提出改进的背景差分法,将原本用于动态目标轨迹检测的背景差分法应用于静态手势分割。即通过背景建模,图片与背景模型在特定阈值上做差分,最后通过连通域及形态学处理分割出手势图像。与以往使用的基于肤色的分割方法和基于肤色及轮廓的分割方法相比,通过对不同场景下分割效果的验证,发现该算法的手势分割效果更好,鲁棒性更强。其次是详细对比了三种经典的分类卷积网络模型。在前述的手势分割算法基础上,选择模型配置以及分类器训练方法。分别使用VGG16、Res Net50和Inception V1在ASL权威手势数据集上进行识别实验并对比实验结果。实验结果说明,仅仅使用彩色图像,使用经典高算力卷积神经网络已能取得不错的识别效果,远胜传统机器学习方法,其中Res Net的网络结构最适用手势识别任务,准确率最高达到87.3%。最后是为了移动端部署而进行的网络模型轻量化改造。对于经典CNN网络模型参数量大、难以部署在移动端使用的问题,本文先详细介绍了经典轻量级网络Mobile Net的网络结构及其轻量化原理,并在ASL数据集上测试其手势识别任务的表现,最后提出一种基于Mobile Net网络改进的轻量级手势识别模型。对网络中的深度可分离卷积用残差模块相互连接,以减少信息的逐层丢失,沟通前后卷积层的特征信息,提高最终的识别准确率。这些连接包括输出与输入尺寸相同时的简单恒等连接,以及输出与输出尺寸不同时的带有1*1卷积的跳跃连接。实验结果表明,新的网络结构很适合手势识别任务,与基础网络MobileNet相比,在计算量不变的情况下,精度提高1.7个百分点。
其他文献
猫儿山自然保护区位于广西壮族自治区东北部。独特的地形使猫儿山地区有着丰富的生物资源。但迄今为止,还没有人对该地区的蝗虫资源作过系统的研究。为了解该地区的蝗虫群落物种组成和结构变化动态,给该地区的害虫综合防治及昆虫资源的开发提供理论依据,我们于2000年7月至10月对猫儿山自然保护区蝗虫生物多样性进行了调查,在不同的生境、海拔及月份对该地区的蝗虫种类及数量进行了抽样统计,将调查到的物种进行了编目,并
C.Nastasescu与F.Van Oystaeyen在一书中,系统地介绍了群分次环和群分次模。两位作者在与S.Raianu合著的一文中,将群分次模推广为G-集分次模,并在此基础上得出了一系列结果。 本文系统地对广义变换群进行了讨论;并利用广义变换群将群作用推广为广义群作用。在此基础上,将G
第一部分:用紫外光谱扫描发现在生理pH(7.43)条件下Co(Ⅱ)与人血清白蛋白(HSA)或牛血清白蛋白(BSA)的结合有明显的滞后效应,表明Co(Ⅱ)与HSA或BSA的结合可能诱导白蛋白发生了构象态的缓慢变化(A-B转化);测得并讨论了这一构象变化的速度常数和活化参数;推测这一构象变化可能是由Co(Ⅱ)结合在白蛋白的N-端三肽段结合位后牵动白蛋白IA亚区内相对疏水的谷作了一次“铰链式运动”,进而
我国经济发展已步入转型期,腾飞式的经济发展推动社会发展,但过去的急功近利造成我们在生态环境方面欠账太多,引发诸多环境问题,政府针对这些问题制定了可持续化发展的解决策略,企图探寻更好的方式促使经济增长形式发生转变,从而实现经济、社会、环境协调进步。金融业作为现代经济发展的核心,其发展必然影响经济,前人已证实金融集聚可以发挥一系列效应促进经济发展,因此,实现绿色经济发展的途径之一也可能是金融聚集。分析
水体环境污染严重,有害藻华现象的频发给生态带来严重的危害,甚至危害人类生存安全。不断的探索新的更高效的抑藻材料是研究者一直以来的追求。化感物质具有可降解、环境友好型等诸多优点,而MOFs中含有金属物质,可以有效的抑制藻类生长。首次将两者结合起来用于抑藻,阿魏酸和Zn2+的共同作用将取得更好的抑藻效果。本文制备并表征了MOFs抑藻物质Zn-MOF-FA,主要研究了阿魏酸和Zn-MOF-FA对铜绿微囊
∏-凝聚环在文[Joh]和[Jon]中被称为强凝聚环。关于∏-凝聚性的最早的著名刻画是在[Ca]给出。Camillo在[Ca]中证明了下列等价:(ⅰ)R是右∏-凝聚的:(ⅱ)R是左*-环; (ⅲ)对每个n≥1,Rn的子集的右零化子是有限生成的。这种环类已被许多作者在诸如[W],[CTHW]和[CY]等文献中研究。特别地,[CY]给出∏-凝聚环更全面的刻画。本文将对∏-凝聚环作进一步研究。
培养学生的绿色环保意识和可持续发展意识是应用化学专业本科人才培养方案的基本要求之一。目前实验教学中培养学生绿色环保和可持续发展意识的实验项目较少,针对这一问题,在综合化学实验中增加本新创实验项目。实验以废弃菜籽油和甲醇为原料,氢氧化钠和氯化胆碱为催化剂,生成的副产物甘油与氯化胆碱原位形成低共熔体系,与产品形成液-液两相,促使反应正向进行,简化后处理,提高产品纯度和产率。GC-MS (Gas chr
随着深度学习理论及相关技术的发展,深度学习模型已经广泛应用于各种实际场景中。不仅图像领域中的目标检测、图像分类、人脸识别等典型的应用场景使用深度学习模型,越来越多自然语言处理的应用场景都在尝试使用深度学习模型,如情感分析、垃圾邮件分类以及机器翻译等。但是深度学习模型在面对对抗样本时表现出很严重的脆弱性,即使在原始数据中加入一点小小的改动都会影响模型的输出。近年来,研究者通过向原始数据中加入人肉眼难
DNA链置换技术推动了DNA计算研究的发展,在DNA计算机的研究中起着至关重要的作用。DNA链置换反应为开发分子计算提供了一套智能工具箱,尽管基于DNA链置换反应的逻辑门电路已经达到了很高的复杂性,但实际可实现的计算任务的扩展仍然是一个障碍。开关电路最初由Shannon于1938年提出,现在广泛应用于电信领域,是实现高速、高带宽通信的一种有效手段。本文研究开发了一种基于DNA链置换反应的DNA开关
目前,国家正积极推进区块链技术和经济社会的融合发展。然而,数字货币作为数字经济基础设施,其保护隐私的特点使其成为了犯罪分子开展非法活动的“温床”。该现象为国家促进数字经济发展,打造安全、稳定、健康的金融环境带来了挑战。因此,从海量交易数据中识别异常交易带来的安全风险,形成监管体系,推动数字经济健康发展,已成为目前数字货币监测监管的重要挑战之一。数字货币的交易账本均是公开访问的。目前,针对数字货币异