立体双目视觉原理及其在手势识别中的应用研究

来源 :北京化工大学 | 被引量 : 2次 | 上传用户:cjl11082009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,三维场景重建技术得到了长足的进步,被广泛的应用于虚拟现实、机器人避障、无人机飞行等领域,手势作为一种自然的人机交互方式有着良好的用户体验受到人们越来越多的关注和研究,引入立体视觉技术使得手势识别不再局限于二维平面,有着更加良好的识别效果,并且可以识别三维手势。双目立体视觉在获取三维深度信息方面有着成本低廉、数据易于获取、非接触式的优点,但处理算法比较复杂。传统基于中央处理器(Central Processing Unit, CPU)、图形处理器(Graphics Processing Unit, GPU)和数字信号处理(Digital Signal Processor, DSP)的处理平台难以满足图像高速实时处理的要求,对高性能嵌入式系统的支持也存在不足之处。现场可编程门阵列(Field-Programmable Gate Array, FPGA)提供大量的逻辑运算单元,在高速图像处理上有着独一无二的优势。Zynq-7000 SoC全可编程片上系统将ARM Cortex-A9处理器与FPGA集成在单芯片中,实现了串行处理和并行处理的完美结合,高效的嵌入式解决方案在性能和成本之间提供更加灵活的选择。论文首先研究了立体视觉技术,分析了传统立体匹配绝对差值和(Sum of Absolute Differences, SAD)算法数据结构在FPGA中的存储方式及运算机制,使用Xilinx提供的高级算法建模工具高层次综合(High-Level Synthesis, HLS)进行编程与优化,实现了一种可以在FPGA上实现的高性能SAD算法。在此基础上研究现有的手势识别技术,针对肤色识别难以区分脸部和手部的缺点,实现了基于双目立体视觉深度信息进行区分的算法。最后在Zynq-7000 SoC器件上对两种算法进行验证,实现了基于立体视觉的嵌入式手势识别系统。实验结果表明,该系统很好的分配了软硬件资源,具有良好的人机交互功能、高速的处理性能和优良的网络远端控制功能,并且相比于其他系统具有更加低成本、低功耗的优势,对未来高性能图像处理系统的设计和实现提供了很好的借鉴。
其他文献
公共事业网络表系统是远程自动抄表系统在燃气管理领域内的实际应用与扩展。它由表具数据采集与监控子系统和燃气服务信息子系统两大部分组成。表具数据采集与监控子系统,提
随着网络技术迅猛发展,大量涌现出以不同形式存储在不同系统中,分而不聚,聚而不合,呈分布异构状态的数据,虽然当前技术能够将计算机在物理上连接起来,但是大多数系统都独自运
近年来,我国的经济快速发展和政府对交通基础设施的重视,各地交通建设发展迅速,在建设发展的过程中,会产生大量的数据,而这些数据可能会出自不同的交通业务部门,造成数据的多
图像镶嵌处理中两幅图像颜色差别较大时,直接镶嵌往往会出现明显的拼接缝现象。目前在图像镶嵌处理中的色彩均衡方法主要有直方图均衡、直方图规定等,上述方法都是根据图像直方
网络优化对于维护整个移动通信网络的正常运行起着至关重要的作用。移动通信网络投入运营后,随着业务的多样性不断扩展,覆盖区域的环境不断变化,用户的数量及其分布不断改变,
盲源分离技术是仅仅从观测到的复杂信号中,分离各个未知源信号的过程,是信号处理范畴中研究的热点,其广泛应用在图像处理、雷达、生物医学等领域。置换混叠图像是一种特殊的
随着Web技术的飞速发展,海量的Web资源大都以异构的、分布的方式存在。传统的数据模型不能有效的管理和定位各种Web资源。资源空间模型(Resource Space Model, RSM)是一种面
近年来随着国际互联网的发展,网络产品的换代、更新、升级,推动了家庭网络发展;光纤宽带技术的推广和普及,人们物质文化水平的提高,给家庭网络的地普及提供了相应的物质技术的支
随着计算机网络的飞速发展和信息数字化程度的不断加深,多媒体数字作品的创作、发布和存储变得更加方便、快捷和高效。然而,由于数字作品的内容可以轻易地被复制和篡改,并通过网
随着IT业的飞速发展,在交通局内部已经建立了许多管理信息系统,积累了大量的历史数据。但随着人们对信息综合利用需求的进一步提高,这些简单的信息管理形成了一个个信息孤岛,