基于反向动力学和马尔可夫模型的三维虚拟手势拟合方法实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:dulcimerqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人类最自然的表达方式之一,指尖跟踪和手势识别一直是人机交互领域的研究热点。手势拟合是一种使用三维程序创建虚拟手并调整其参数使之能够和摄像机获取的手势最为匹配,来完成指尖跟踪与手势识别的一种方法。针对在手势拟合过程中难以同时满足精度和速度要求的现状,本文提出并实现了一种高效的通过使用普通摄像头来拟合手势的方法。实验表明该方法可以弥补普通摄像头缺少深度信息造成的不足,提高手势识别率。同时在一些无法检测到指尖的情况下也能有不错的表现。  通过反向动力学和能量最小的原则,本文实现了将手势中的关键点数量降低的目的,并对手势各关节之间添加了约束。使得整个手势能够更加自然,通过关键点解算手势状态也更加快速。由于反向动力学具有高鲁棒性的优点,当指尖点位置不准确时,依然能够解算出相对最优的手势姿态。这为快速完成手势拟合提供了基础条件。通过实现马尔科夫模型,手势拟合问题可以转化为最优化问题。对关键点的参数进行多次尝试,并利用每次尝试的拟合结果对当前虚拟手的手势进行反馈,直至虚拟手手势和摄像机获取的手势图达到最佳拟合,即可完成一次虚拟手手势解算。为了能够快速获得最优解,本文提出一种混合分层抽样法,牛顿下山法和最速下降法的算法来进行优化,使整个过程能够更快速、准确和稳定。  与之前的研究成果需要昂贵的硬件设备支持相比,本文的方法需要更少的资源,能够确保在当前主流电脑配置上流畅运行。
其他文献
元计算系统(简称元系统)是可以作为虚拟的整体而使用的地理上分散的异构计算资源,这些资源包括主机、数据库和超级计算系统等.元计算系统在硬件和软件等方面均有异构性,适合
流媒体是指采用流式传输的方式在Internet播放的媒体格式,而流式传输方式则是将整个音频和视频等连续媒体文件经过压缩后,由服务器向用户计算机连续和实时传送.针对网络I/O的
现代通讯技术的迅速发展和普及给人们的生活和工作带来极大便利,然而也使得通讯过程所面临的环境更加复杂,由此增加了通讯时目标语音受到各种类型信号干扰的概率。为了保证通讯
该文介绍的所有的工作都是围绕着这个对话系统,为这个对话系统加入声学识别引擎.这个声学识别引擎和现有的语言理解系统及对话管理系统,组成了一个完整可用的对话系统.该文的
该文以多数据库的语义异构性为基础,围绕全生命周期的语义特性,提出了具有强语义特征的多数据库集成体系结构,并在多数据库语义增强、模式集成、全局语义查询优化等方面进行
该文研究并实现了一个多维查询分析系统,提出了基于OLAP的多维分析算法.主要工作包括:1)从多维查询分析系统的功能设计出发,给出了系统整体的体系结构,并就每个模块做了具体说
随着数据业务以及多媒体业务的迅猛增长,人们对定位和导航的需求日益增大,人们在复杂的室内环境下,如火车站、机场大厅、展览厅、大型商场、图书馆、地下停车场、矿井等环境中也
该文试图在对称多处理机调度这个方向寻找突破点,从引入多处理机并行系统体系结构的沿革和发展概况等背景知识入手,介绍对称多处理机SMP结构概况,然后讨论了在SMP结构下,多处
信息技术的深入应用,使得企业业务流程日益丰富,从业务流程库中便捷、快速发现用户所需流程或对用户进行流程推荐辅助建模行为是业务流程管理系统的关键技术之一,也是当前业务流
该文对移动代理及其涉及到的相关技术如代理、分布式技术、序列化、RMI等进行研究、分析,并提出其整体的体系结构.针对移动代理及支持其运行的平台系统,该文提出了移动代理系