基于Kinect深度信息的人体检测技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ning012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测技术是计算机视觉领域一个重要的研究方向,是实现智能监控等应用的关键,具有很强的实用价值。许多基于人体目标的高级技术,如异常行为分析、行人追踪等,都直接依赖于人体检测结果的精度,因此人体检测也具有良好的研究价值。  现有的基于彩色图像的人体检测技术经过几十年的发展,取得了丰富的研究成果,但其检测精度和检测速度很难进一步提高。首先,从数字图像中提取的人体特征与人体高层语义之间存在着语义鸿沟,现有的特征提取方法对人体特征的刻画能力很难进一步提高;其次,特征的提取需要在图像的多尺度空间进行穷举式搜索,检测算法的时空开销很大;最后,彩色二维图像对场景信息的描述维度有限,并且光线变化等情况会对成像质量造成影响,导致检测精度的额外下降。  随着Kinect的出现,获取廉价且可靠的深度图像成为可能,为人体检测技术的研究带来了新的探索方向。  本文分别基于Kinect采集的深度图像和深度视频,在使用深度信息缩小检测时间和提高检测精度等方面作出尝试。在深度图像上,提出了基于深度信息获取检测窗口算法,能够直接计算检测窗口的位置和大小,避免了在图像的多尺度空间进行穷举搜索。在深度视频上,提出一种结合非参背景建模和深度特征的人体检测算法,该算法通过对运动信息的提取,缩小了需要进行人体检测的区域,并通过改进结果融合过程,提高了检测精度。  本文主要工作如下:  1)结合Kinect深度图人体成像特点,给出了一种基于深度信息直接计算检测窗口的算法。针对某些情况下检测窗口中心出现漂移的情况,提出一种自适应的图像分层算法,对检测窗口中心的计算过程自动进行纠正。相比于滑动窗口方法,基于深度信息快速获取检测窗口算法不需要对目标可能出现的位置进行穷举,大幅减少了生成的检测窗口数量,提高了检测效率。  2)改进了非参核密度估计背景建模方法中的子模型更新方式,通过融合改进后的两个子模型建模结果,提高了建模方法捕捉长时稳定背景的能力。在背景减除的过程中使用改进的建模方法,提取深度视频场景中包含人体目标的各个区域。改进后的算法在深度视频上表现出比在彩色视频上更好的提取效果,对百余帧内无明显动作变化的人体目标也能够无遗漏地提取出来。然后,基于背景减除得到的前景区域,通过深度图与彩色图对齐,实现了联合深度与彩色信息的人体检测。  3)针对人体成像重叠时,结果融合过程中经常出现的错误融合情况,提出一种度量检测结果窗口深度相似性的方法,并根据各窗口的相似性进行结果融合前的预处理。改进后的方法避免了在非极大值抑制过程中只依靠位置信息筛选检测结果,降低了人体检测算法的漏检率。  4)在上述工作的基础上,设计并实现了基于深度信息的人体检测系统,并对本文提出的算法在数据集上的实验统计结果进行了分析和评价。
其他文献
路由协议设计是无线传感器网络的一个重要研究领域,可靠性、低开销、易于维护是无线传感器网络路由协议的设计目标。本文充分调研无线传感器网络中的层次型路由协议、链式路
过去几十年,布料仿真技术一直是计算机图形学领域的研究热点,但是快速、理想的布料仿真的实现直到现在仍然是一个挑战。目前的布料仿真环境中,布料之间的碰撞检测与碰撞响应的准
随着互联网技术的高速发展,XML已成为互联网中数据交换和表示的事实标准,XML相关技术也在各种XML信息平台上扮演着重要的角色。国际互联网组织W3C提出的XQuery语言是当今最主流
GPS全球定位系统是利用卫星定位的,能够快速、实时地确定任一地面目标点的空间坐标.GPS与城市消防地理信息系统的结合可以用来更新消防GIS的空间数据库,可实时地将目标的空间
该文主要从以下几个方面讨论了对象WEB技术的基本原理及其在OMA2000系统中的具体应用和实现.(1)从理论上介绍了对象WEB技术的基本概念,讨论了该技术的JAVA-CORBA框架模式,以
近年来,由于互联网及数码设备的日益普及,视频的内容分析和处理受到各界的广泛关注。其中,基于视频的人体动作识别方法在近年来被广泛应用于各个领域,成为热门的研究方向。但
随着现代社会节奏的日益加快,计算机网络进入了飞速发展时期,逐渐成为了人们日常生活中信息交流的主要渠道。然而在网络上的信息传输仍然面临着很多安全问题,同时也对国家经济造
随着信息化技术的飞速发展,网络成为信息交流的重要平台,信息化教育技术受到越来越多高校的重视,建设一个健全的数字换校园成为高校的一个重要课题。传统的教学方式已不能满足高
互联网络为网民发表评论、交换观点带来了极大的便利,也为人们的决策提供了有力的支持。消费者很容易在餐馆点评网上对餐饮与服务进行评论,为新的客户选择餐馆提供依据;人们也
XML是一种半结构化的数据描述语言,因其具备高可读性、跨平台性和可扩展等特性,在互联网领域被广泛应用。为了推动XML数据查询和处理的标准化,国际万维网组织W3C发布了XQuery