论文部分内容阅读
随着信息技术的发展,三维场景重建技术得到了长足的进步,被广泛的应用于虚拟现实、机器人避障、无人机飞行等领域,手势作为一种自然的人机交互方式有着良好的用户体验受到人们越来越多的关注和研究,引入立体视觉技术使得手势识别不再局限于二维平面,有着更加良好的识别效果,并且可以识别三维手势。双目立体视觉在获取三维深度信息方面有着成本低廉、数据易于获取、非接触式的优点,但处理算法比较复杂。传统基于中央处理器(Central Processing Unit, CPU)、图形处理器(Graphics Processing Unit, GPU)和数字信号处理(Digital Signal Processor, DSP)的处理平台难以满足图像高速实时处理的要求,对高性能嵌入式系统的支持也存在不足之处。现场可编程门阵列(Field-Programmable Gate Array, FPGA)提供大量的逻辑运算单元,在高速图像处理上有着独一无二的优势。Zynq-7000 SoC全可编程片上系统将ARM Cortex-A9处理器与FPGA集成在单芯片中,实现了串行处理和并行处理的完美结合,高效的嵌入式解决方案在性能和成本之间提供更加灵活的选择。论文首先研究了立体视觉技术,分析了传统立体匹配绝对差值和(Sum of Absolute Differences, SAD)算法数据结构在FPGA中的存储方式及运算机制,使用Xilinx提供的高级算法建模工具高层次综合(High-Level Synthesis, HLS)进行编程与优化,实现了一种可以在FPGA上实现的高性能SAD算法。在此基础上研究现有的手势识别技术,针对肤色识别难以区分脸部和手部的缺点,实现了基于双目立体视觉深度信息进行区分的算法。最后在Zynq-7000 SoC器件上对两种算法进行验证,实现了基于立体视觉的嵌入式手势识别系统。实验结果表明,该系统很好的分配了软硬件资源,具有良好的人机交互功能、高速的处理性能和优良的网络远端控制功能,并且相比于其他系统具有更加低成本、低功耗的优势,对未来高性能图像处理系统的设计和实现提供了很好的借鉴。