应用Kinect的人体行为识别方法研究与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:sunshinewlm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉研究的一个重要课题,有着巨大的研究价值和广阔的应用前景。目前,它的应用主要集中在智能安防、病患监护、人机交互等领域。传统的人体行为识别研究主要是基于RGB图像序列与深度图序列,在研究中其局限性不断显现出来:二者都面临着复杂背景的干扰,RGB图像更是丢失了深度信息。而基于骨骼数据的人体行为识别,排除了背景的干扰,并且数据量较小,于是慢慢吸引了研究者的关注。在2010年,微软推出了一款叫做Kinect的体感设备,该设备不仅可以获取RGB图像,还能获取深度图与骨骼信息。该设备的出现,使基于深度图与骨骼信息的人体行为识别研究更加便利。本文基于深度图与骨骼数据提出一种多特征融合的人体行为识别方法。在深度图方面,使用现已成熟并且表现良好的Depth Motion Map-HOG(DMM-HOG)特征。在骨骼数据方面,对Histogram of Oriented Displacements(HOD)特征进行多处改进,形成新的3D-HOD特征。然后,在DMM-HOG特征和3D-HOD特征上应用后期融合进行人体行为识别。HOD特征利用位移的尺度来构建描述符,不需要对目标的位置进行任何预处理,并且计算效率高。改进的3D-HOD特征继承了HOD特征的优势,并对HOD特征的缺陷进行改进。对HOD特征的改进主要有三点:1.对骨骼节点进行删选,去除手(Hand Right,Hand Left),足(Foot Right,Foot Left),脊柱(Spine)这5个节点,使用剩余的15个节点信息进行特征提取,保证特征准确性的同时减轻计算负担;2.HOD特征借助三个投影平面来构建三维轨迹描述符,本文将三维空间分为24个方向,在三维空间上对运动轨迹直接描述,更准确地反映出真实的运动变化,使描述符更为精确;3.利用符合运动规律的时间金字塔,使水平方向上的低层直方图之间存在较为理想的差异,更精确地表述时序信息。在多特征融合工作上,分析前期融合与后期融合,后期融合的优势在于可以对不同的特征分别设置参数,充分发挥多特征融合的优势。在特征选择上,使用深度图DMM-HOG特征与骨骼数据3D-HOD特征进行融合,由于这两种特征的提取来源不同,在特征提取中所关注的细节也不同,对同一运动行为进行描述时,两种特征具有良好的互补性,使得融合后对人体行为的特征描述更加准确。在实验中,使用MSR-Action3D数据集进行测试,选取HOD特征的多种配置与改进后的3D-HOD特征进行对比,证明对HOD特征的改进工作十分有效;选取多种基于深度图或骨骼数据的识别算法与应用特征融合的DMM-HOG+3DHOD特征进行横向对比,证明DMM-HOG特征与3D-HOD特征融合后具有优异的识别效果。实验表明,本文提出的多特征融合人体行为识别方法具有良好的准确性。
其他文献
互联网技术的迅猛发展和快速普及,直接影响着人们生活的方方面面,人类的社会行为也在潜移默化中发生着变化。高度信息化的社会像一个巨大的网络将地球上的万物包罗其中,地球
随着RFID技术的不断发展,RFID的应用越来越广泛,其中包含关系探测受到国内外学术界和产业界的广泛关注。现实生活中广泛存在包含关系,这种关系相比于标签对象间简单的伙伴关
随着移动技术的快速发展,基于位置服务的应用使人们的生活越来越便捷,用户在享受便捷服务的同时,个人数据的隐私泄露问题也愈发严重。本地化差分隐私,由于其继承了中心化隐私保护方法被广泛应用于保护用户个人的敏感信息,已经成为当前研究的热点问题之一。基于本地差分隐私下的发布数据所采用的方法有数据扰动、数据压缩和数据扭曲三种方式,其中最为常用的是随机聚集有序相应隐私保护方法(RAPPOR,Randomized
随着云计算的发展,产生了面向组件服务的云应用系统。云应用系统以业务流形式向用户提供服务,而不同的业务流中的不同任务被分配到不同的组件服务上,这些组件服务共同构建应
随着信息技术的高速发展和智能手机的普及,基于手机的室内定位技术逐渐成为研究的热点。目前在室内定位技术中,基于地磁匹配(MagneticMatching,MM)的室内定位方法,无需额外设
主从式遥操作微创手术机器人是国内外医疗领域的研究重点。微创手术可以为患者和医生带来诸多好处,如切口小、手术时间短、恢复时间快等。力反馈是当今微创手术机器人的研究
智能终端的普及与无线网络技术的进步推动了实时流媒体业务的蓬勃发展。如何通过多模终端的无线网络接口,利用多路径传输技术并发传输数据,为实时流媒体业务提供高质量的传输
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等
随着社会经济的不断发展、科学技术水平的不断提升,互联网上的数字视频正不受限制地增长并且逐渐成长为一种新型的力量。这些视频大多数存储在非结构化的存储库中,因而对图像
纸介考试,作为课程评价过程的一个重要环节,是对课程和教学质量进行反映和评估的重要手段。现行的纸介考试多数根据外在的客观标准进行评价,在评价的过程中往往是外在的标准