基于红外摄像头的手势识别

来源 :东南大学 | 被引量 : 0次 | 上传用户:dsclq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物质生活的不断丰富,人们开始探索贴合人类使用习惯的人机交互技术,其中基于视觉的手势识别技术为机器理解手势提供了必要的辅助。基于图像的手势识别无需佩戴其它额外的硬件设备,与传统的输入方式相比,无需人机接触,且易于操作,在手语识别、辅助驾驶、设备控制、智能家居等交互领域具有广泛的应用。然而,目前大部分的研究仅限于光照充足的环境下,对于全天候执行的任务,特别是军事、安防领域等需要夜间执行的工作,普通彩色摄像头无法胜任,很大程度上阻碍了手势识别的实用化进程。基于以上研究现状,提出将手势识别技术与红外夜视技术相结合的研究,围绕红外图像的特点,实现夜间环境下的多种手势识别,具体的工作如下:采用近距离微弱红外辅助照明获取红外图像,针对夜间拍摄噪声干扰严重,画质较差的问题,分析噪声产生的原因,通过非均匀性观察实验分析红外噪声的特点。针对噪声所呈现的条纹特征,提出基于卡尔曼滤波的校正方法,该方法不仅去除了大幅噪声波动,还对细节特征有较完整的保留,对提高红外图像的质量有实际意义。针对近距离微弱红外辅助照明获得的红外图像,利用手势与背景之间的灰度差,使用基于K-Means聚类的分割算法,提取手势区域,然后根据手势的几何信息进行分类。通过实验分析可得出K-Means聚类算法存在局限性,手势分割的完整性除了受光照均匀性的影响外,算法稳定性还与K值、初始种子点的选取有关。针对手势位置偏离光轴,造成灰度不均匀的红外图像无法通过聚类算法得到有效手势的问题,提出基于HOG特征的SVM手势分类算法。基于红外手势的特征金字塔建立手势分类模型,该模型无需依赖于手势分割的结果,算法的可用性得以提升。基于上述研究工作,本文实现了夜间红外图像的多种手势识别。通过基于卡尔曼滤波的红外图像条纹噪声去除算法,提升了红外图像的峰值信噪比,并在此基础上通过手势识别算法,进行夜间环境下的十种红外手势识别。经测试评估,识别率为91.8%,不受光源引起的非均匀性影响,能够较好地实现夜间环境下的多种手势识别。
其他文献
数字图像相关方法(Digital Image Correlation,DIC)是一种非接触式的全场变形测量方法,有着操作较便捷、对测试环境要求较低等优点,在航空航天、土木机械、生物医学等各个领域中得到了广泛的应用。近年来,研究人员对于高精度、实时测量的要求逐步提高,实验数据量随之增大。这不仅对测量硬件提出了很高的需求,对处理图像数据的软件算法也提出了新的挑战。如何有效地降低单幅图像数据量、提升DI
近年来,图像分类在卫星图像检测、医学图像处理、地貌图像识别、人脸识别、环境监测等方面的应用场景十分广阔。同时,图像分类算法在硬件终端中应用与部署的需求与日俱增,如何将这些算法移植到硬件终端并进行性能上的优化成为图像分类研究的热点与难点。为此,本文提出了一种基于FPGA的图像分类算法,并在Xilinx的Zynq-7000系列平台上对该算法进行移植和加速,以验证该算法的有效性。本文的主要内容包括:首先
混凝土3D打印技术具有构件设计自由、施工高效、节省劳动力等特点,引发建筑领域越来越多的关注,成为建筑工业化的重要发展方向之一。目前该技术已经得到初步的工程应用。然而粉床3D打印技术的基础研究不够完善,缺乏设计粉床3D打印材料的系统方法,从而限制了该技术的进一步发展。因此,本文建立了表征液体和粉体相互作用结果的指标,探究了相关影响因素,并揭示了液体在粉床中的渗透过程及机制。本文首先采用单向渗透的实验
物联网技术一直被视为信息技术领域的第三次浪潮,射频识别技术作为物联网的关键技术得到了广泛的研究。但传统射频识别(RFID)系统中必须配备专用阅读器,并通过专用射频信号进行通信,导致系统通信距离短,且无法与其他网络直接相连。对此学术界在近几年提出了一些新型反向散射(Backscatter)技术,通过复用环境中的已有的射频信号作为载波信号来提升RFID系统性能。与此同时,在定位技术领域,学术界新提出的
城市用地作为用于城市建设和满足城市机能运转所需要的空间,在城市计算中属于重要的基础性数据。从微观角度对城市用地功能进行分类,可以辅助城市规划中的控制性详细规划和修建性详细规划工作的展开。然而,目前的城市用地功能分类仍然面临许多困难。城市用地的概念定义和研究角度标准不一,适合城市用地功能分类的数据源较少,城市之间的差异性对算法的泛化性能提出了挑战。本文的研究目标,是通过采集开源地理信息数据,对建筑级
随着互联网技术的发展以及电子商务平台的推广,越来越多的用户选择网上购物,线上消费,因此针对消费者对商品或者服务的评价的情感分析便成为当前的一个研究热点。在深度学习得到广泛应用的背景下,作为图像领域的标配网络——卷积神经网络,由于其在自然语言处理领域不能处理长序列文本以及存在信息丢失的问题,使得卷积神经网络在文本情感分析领域总是和时序网络结合使用。本文分别从改进卷积神经网络结构和从文本情感构成两个思
深度学习是近几十年全球瞩目的焦点,基于卷积神经网络的人脸检测研究逐渐取代人工模板传统方法,获得了更全面、充分地发展。基于深度神经网络的人脸检测方法倡导自主习得面部特征,按照是否存在区域提议过程可大致划分为两步法和一步法。两步法只有在生成了候选区域后才进行分类和回归,是粗到精的过程,检测精度高,更适用于多分类场景,如植物、汽车等。人脸检测是典型的二分类问题,且在实际应用中对实时性有一定要求,而两步法
航天飞行器结构在太阳辐射环境下所产生的热变形使得结构的力学性能发生变化,降低了飞行器正常工作性能,严重时会影响飞行器的安全,因此在地面试验阶段开展飞行器关键结构的热试验是十分有必要的。数字图像相关(Digital Image Correlation,DIC)法是一种测量物体表面变形的高精度光学测量方法,与传统应变片单点测量方法相比,DIC可以实现物体表面的全场变形测量,由于其非接触式的测量特性,使
近年来,随着移动通信网络从3G经4G到5G的跨越式发展,移动互联网正逐渐渗透到人们生活和工作的各个领域。在全球智能手机市场中,由于5G手机的发布以及相关厂商加速清理旧设备库存,导致Android设备的市场份额不断增加,各种应用软件也层出不穷。由于众多的第三方应用商店缺乏统一的审核和监管应用的规范,恶意应用软件的数量急剧增加。因此当前研究的热点之一是开发出高效、自动化的检测方法,有效地检测出Andr
数字图像相关方法作为一种高精度、非接触式的全场变形测量方法,已经在土木交通、生物医学、航空航天等领域有了广泛的应用。对于一种测量方法来说,其测量结果的准确性和一致性是最为重要的,因此有必要对数字图像相关方法测量精度和测量结果的一致性展开研究。目前对散斑场参数的选择和测量系统的布置方面已经有了大量研究,但对相机标定和计算参数选择的研究相对较少。由相机标定或计算参数选取不当导致DIC测量结果不一致甚至