【摘 要】
:
随着科技的发展与进步,人工智能的浪潮席卷全球,使得生活变得更加智能化。其中,人机交互则在其中起着重要的作用。手势识别作为人机交互中最简单自然地一种方式,引起广泛关注。而基于视觉的手势识别不依赖其它设备,操作更加自然方便。实际场景中的手势识别系统通常对于实时性和准确率有较高的要求,因此如何在保证算法正确性的同时,提高算法的实时性是研究的关键。针对视频流中手势特征描述困难以及在视频序列中存在较多冗余信
论文部分内容阅读
随着科技的发展与进步,人工智能的浪潮席卷全球,使得生活变得更加智能化。其中,人机交互则在其中起着重要的作用。手势识别作为人机交互中最简单自然地一种方式,引起广泛关注。而基于视觉的手势识别不依赖其它设备,操作更加自然方便。实际场景中的手势识别系统通常对于实时性和准确率有较高的要求,因此如何在保证算法正确性的同时,提高算法的实时性是研究的关键。针对视频流中手势特征描述困难以及在视频序列中存在较多冗余信息的问题,提出了融合循环三维卷积神经网络(Recurrent Three-dimensional Convolution Neural Network,R3DCNN)和注意力机制的手势识别方法。主要工作包括:(1)构建了一个端到端的循环三维卷积神经,利用三维卷积提取局部时空特征,并且利用长短期记忆网络对短时空特征建模,得到能够准确表示视频中动作运动信息的全局时空特征。(2)针对视频序列无字典标签,无法进行加权,定义了一个时间编码模型对于视频序列进行分段,构建字典标签。(3)针对视频中存在冗余信息的问题,提出融合注意力机制和循环三维卷积神经网络的方法,利用注意力机制对于提取到的视频分段特征进行加权,提高作用较大的分段特征的注意力权值,使模型能够更加关注重要的视频序列,从而提高模型识别的准确率。为了验证算法的有效性,在大规模公开数据集上对算法进行了测试并与其他主流方法进行了对比试验,发现融合循环三维卷积神经网络和注意力机制的手势识别方法不仅能够有效的提取视频中的运动信息,而且将关注点集中在对于结果影响较大的片段,并且在实际场景中对算法进行了测试,发现具有较好的实时性以及较高的准确率。
其他文献
相机源识别是数字图像取证中研究课题之一。通过校验图像的相机来源的真实性,以辅助各种刑事调查和审判及解决版权侵犯等中的取证环节。得益于深度神经网络的发展,其识别准确
一直以来,图像超分辨率重建都是图像处理领域的一大热点问题。目前,基于深度学习的方法作为图像超分辨率重建方法的首选,已经在视频监控、遥感卫星、医疗成像以及多媒体等领
广西平班水电站采用的轴流转桨式水轮机常见于中低水头的水电站。水轮机组在运行一段时间后由于机械结构磨损,水文情况变化等各样原因导致机组协联关系与出厂时协联关系不匹
云计算虚拟机技术的发展对存储系统的性能提出了前所未有的挑战。在传统的IT架构中,网络存储设备只为少量的服务器提供存储服务,而在云计算虚拟化环境中,网络存储设备需要为
改革开放以来,我国经济发展取得了举世瞩目的成就。我国丰富的劳动力资源成为社会经济发展的主要动力,而与之相悖的是近年来我国的劳动参与率逐年下降,有效劳动力人口也在逐
在自组织无线传感网中,所有节点平等独立且不依赖于任何路由基础设施,它们通过互相中继数据包完成信息传递。因此,自组织无线传感网依赖于所有参与节点的协作才能正常工作。
自由空间光通信(FSO)普遍被认为是解决“最后一公里”问题的首选方法,它具有传输速率高、功率能耗低、频带宽和方便部署等优势被国内外科研人员认为其应用潜力巨大。随着人们
磁斯格明子(magnetic skyrmion)作为一种奇异的拓扑自旋结构,凭借纳米级准粒子特性以及低电流驱动密度,有望成为新一代赛道磁存储器件的信息存储单元,近几年已成为磁学领域研究
随着社会新型风险的增多和风险刑法理论的推进,抽象危险犯作为危险犯的一种,因其能够对法益提供更为提前的保护而越来越受到各国立法者的青睐。以我国为例,《刑法修正案(八)》和《刑法修正案(九)》便大量采用了抽象危险犯的立法模式。不过虽然抽象危险犯相对简易的认定过程有利于更好的管控风险,但是也蕴藏着侵犯公民自由的风险,现如今抽象危险犯便存在着范围过宽和重刑化的问题,为了使得刑罚的公平正义之剑挥向正确之处,
现如今,随着数据存储的需求日益提升,存储系统规模的增大,存储设备失效的风险也随之提升。能容忍三磁盘同时失效的存储阵列因而被广泛采用,这类存储阵列通过采用纠删码技术来