基于表观的手势识别及人机交互研究

被引量 : 69次 | 上传用户:liuling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
具有与用户自然交互的能力是仿人机器人能够融入人类社会的关键,从机器人方面来说,交互涉及到感知通道和效应通道,感知通道接受环境的信息,效应通道是机器人作用于环境,控制交互过程中的信息接收。手势作为一个自然、直观的交互通道,在人机交互过程中起着重要的作用,不仅是一个交流信息和意图的通道,更是示范学习过程中一个必不可少的载体,可以使得普通的用户通过自然的方式与机器人沟通。在人机交互过程中,头眼协调运动控制有助于机器人有选择地获取外界信息,获得感兴趣的焦点,增强人机交互过程中的自然性。本文从自然人机交互的角度出发,研究了独立于用户和视角的手势识别以及交互过程中机器人的头眼协调运动控制,在自主开发的通用仿人机器人头部系统平台基础上,构造了一个基于自然手势的人机交互系统,为后续的示范学习等研究奠定了平台基础。具体研究工作包括以下几个方面:(1)在静态手势识别方面,考虑到现有正向手势识别系统中所采用的特征不足以充分地表征自然手势,提出了使用完备特征集来等价地描述手势特性,根据提取Zernike矩的重构效果,来确定能够充分地表征手势的特征集,在计算矩的过程中提出了最小方形边界的概念,以获得在相同阶次下Zernike矩最大的图像表征能力;另外等价特征的个数也揭示了手势集的复杂度,客观地反映出某种手势被识别的难易度。在特征降维方面,从分类的角度,提出了基于类别邻域的Isomap降维方法(Category Neighbor-Isomap,CN-Isomap),在特征降维过程中利用样本的类别信息来保持原样本之间固有的几何结构关系,实现准确降维。(2)关于动态手势识别,通过分析现有识别算法的特点和自然人机交互过程中的动态手势特性,提出了基于时间轴压缩的手势时空建模方法,以消除手势的时空差异性,同时也是为了能够在此建模的基础上识别由不同用户在不同视角下作出的手势。根据动态手势的运动特性,提出了速率边沿检测算法来分割手势的起止过程,通过跟踪图像平面内的手势运动,得到表征手势的一系列离散轨迹点。基于格式塔心理学的知觉定律,采用3次B样条拟合出手势的表观轨迹。引入曲线矩和仿射不变矩作为手势表观轨迹特征。针对特征空间中手势样本的不规则分布,提出了多变量分段线性决策树分类器,与通常的多变量决策树相比,树的规模更小,泛化性能更好。(3)研究了基于手势交互过程中的机器人头眼协调运动问题。人机交互是一个双向的过程,机器人需要对用户的手势作出反应,在多自由度的头眼系统上,为了保证交互的连续性和成像的清晰性,需要有效地协调头和眼的运动。通过使机器人双眼聚焦在同一个注视点,得到注视点的空间坐标和头眼的期望运动转角;研究了机器人头部转动时双目的补偿运动模型及相应的控制算法。建立了一个6自由度的仿人机器人头部系统平台,从仿生学角度来说,这6个自由度的运动最具有代表性,并且最精简地模拟出人类头部的主要运动形式。在多自由度机器人头部的注视实验表明,该模型能实现精确的三维头眼协调运动控制。
其他文献
采用快速凝固/粉末冶金法制备镁合金时,可以显著细化合金的晶粒组织、减少甚至消除粗大的平衡析出相,从而显著提高合金的塑性变形性能和力学性能,这对高强高韧性变形镁合金材
多向锻造技术是一种强应变塑性变形技术,可以细化组织,提高性能。目前国际上有关镁合金多向锻造技术的研究报道很少,为此本文以两类代表性镁合金Mg-Al-Zn系(AZ31和AZ80合金)
本文基于角膜反射-瞳孔中心的视线跟踪技术,构建了头部静止台架式和头部自由运动头盔式两套视线跟踪硬件框架,并开发了与之配套的软件系统。本文开发的视线跟踪系统能够实时
元曲是我国文学发展史上一个重要阶段,素来与“唐诗”“宋词”并称。“元曲”这一称谓始出自明人之口,其主体是元代杂剧。《元曲选》是明代著名戏剧家臧晋叔选编的元杂剧选集,学
澳大利亚于1972年同中华人民共和国建立外交关系。建交以后,尽管两国关系发展并不一帆风顺,特别是由于政治制度不同,意识形态迥异,以及长期以来澳大利亚所形成的西方认同感,致使两
介绍了果蔬中多糖功能因子的资源分布,描述了分离果蔬多糖的方法,阐述其保健功能,结合生产实际,展望果蔬多糖的应用前景,指出果蔬多糖在食品、医学等领域具有广阔的市场前景
颌骨造釉细胞瘤是最常见的牙源性肿瘤,约占全部牙源性肿瘤的63%.
本文将高效数字调制方式QAM和软件无线电技术相结合,在大规模可编程逻辑器件FPGA上对16QAM算法实现。在当今频谱资源日趋紧缺的情况下有很大现实意义。论文对16QAM软件实现的
随着人机交互技术的不断发展,各种各样的新型人机交互技术不断涌现。基于视觉的手势识别技术由于比较符合交流习惯成为近年来应用于人机交互技术中的一项关键技术。基于视觉
近年来,学术界和工程界已经注意到超长桩的承载机理不同于普通中短桩的承载机理。在实际工程中根据现行规范规定的普通中短桩的标准进行超长桩的设计施工与实际观测结果有较