手势识别关键技术及其在智能实验室中的应用研究

来源 :中国科学院大学(中国科学院上海技术物理研究所) | 被引量 : 9次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实验室作为航天科研单位研发与生产的重要场所,是实现智能生产的载体。随着“工业4.0”、“互联网+”等与智能制造相关的概念被提出,智能实验室将是未来航天智能制造基础设施中的关键组成部分。本课题以人工智能已经成为国内外的未来发展趋势为背景,融合计算机视觉和机器学习技术,开发了一套智能实验室中的手势识别结构框架,提高了实验室的智能化水平,从而加快了实验室的研发和生产效率。手势识别可以看作是一种机器来理解人的身体语言的方式,而利用手势识别技术可以将传统人机交互中的通过键盘或者鼠标输入的交互方式拓展为通过摄像头远程识别手势进行交互,这无疑对推动人机交互的发展具有重大意义。因此,为了提高实际复杂场景的人机交互中动态手势识别的准确性和实时性,本课题提出了一种基于时序局部敏感直方图(Temporal Locality Sensitive Histograms of Oriented Gradients,TLSHOG)特征新方法的手势识别结构框架。该手势识别结构框架主要有两个部分组成:(1)采用深度学习物体识别模型SSD(Single Shot Multi Box Detector),对视频帧中出现的手势区域进行实时的精确检测;(2)采用TLSHOG特征新方法描述手势运动的时序变化和空间姿态,实现了快速而精确的动态手势识别。TLSHOG算法的主要步骤如下:首先,采用普通网络摄像头获取手部的二维图像序列作为训练样本,然后构造单帧图像特征描述手部的空间姿态,并结合时间金字塔(Temporal Pyramid,TP)来描述手势运动轨迹的时空特征,运用多维支持向量机(Support vector machine,SVM)算法进行模型训练,对测试样本中的多种手势进行精确的分类。本课题构建了新的手势识别结构框架,在包含24种手势的国际基准ASL Finger数据集获得识别精度0.903,不仅在与其他算法的精确度对比中名列前茅,并且处理速度达到了12fps以上,体现了本文算法的优越性。此外,为验证成果的实用性,实验采用本课题构建的手势识别识别结构框架对真实场景视频数据中的动态手势进行了识别,获得了0.893的识别精度和14fps以上的处理速度,无论是精确度还是实时性都满足了实际应用的要求。综上所述,可以得出以下结论:本文算法准确度高、实时性好、实用性强,对于复杂背景干扰、光照强度变化和手势姿态变化均有有较好的鲁棒性。
其他文献
1性质地位母婴护理是高职护理专业以生命周期为轴线的一门核心课程,其护理技术、保健宣教关系到优生优育,甚至关系到一个地区、国家的人口素质。母婴护理课程主要介绍在妊娠期
【正】 首先应当明确指出,通俗唱法的许多特征基本上是来自于欧洲、美洲、非洲以及亚洲的一些民族民间音乐传统,特别是美国摇滚乐和爵士乐对通俗唱法的影响最为明显.无论歌唱
篮球发展的趋势,"进攻赢得比赛,防守赢得总冠军。"个人防守技术的高低,对于篮球整个防守体系的影响是巨大的,甚至可左右比赛的胜负。随着"小球旋风"的盛行,如何快速进行攻防
<正> 汉武帝管榷盐铁,禁止私营,使有关国计民生的两大产业部门成为官营垄断企业,给当代社会经济和后世历史以深远影响。值得提出的问题是,当时盐铁官营的具体做法究竟怎样?两
期刊
目的:探讨关节镜手术清创治疗人工膝关节置换术后感染的方法及临床疗效。方法:回顾性分析2007年2月~2012年11月间使用关节镜手术清创、术后持续灌洗治疗的9例人工膝关节初次
【目的】研究铅(Pb)胁迫下小麦百农160和偃展4110体内Pb亚细胞分布和化学提取态变化,为Pb低积累品种筛选提供理论依据。【方法】以前期筛选的对Pb吸收有明显差异的2个小麦品种(
毕业论文是培养学生综合能力和科学研究能力的一个重要手段。本文在分析影响毕业论文质量因素的基础上,针对选题、开题、中期检查、答辩等环节提出了相应的质量提高方法,并对
目的探究腹腔镜辅助根治性手术和开腹手术治疗直肠癌的短期临床疗效比较。方法将我院收治的50例直肠癌患者随机分为研究组和对照组,每组各25例,研究组患者行腹腔镜辅助根治性
供给侧结构性改革将为中国经济未来行稳致远、健康活力发挥重要作用,供给侧结构性改革的五大任务将为金融业提出更新、更高的要求。目前,金融助力黑龙江供给侧结构性改革取得
当用Lagrange插值多项式逼近函数时,重要的是要了解误差项的性态.本文研究具有等距节点的Lagrange插值多项式,估计了Lagrange插值多项式逼近函数误差项的上界,改进了小于5次L