论文部分内容阅读
人体检测技术是计算机视觉领域一个重要的研究方向,是实现智能监控等应用的关键,具有很强的实用价值。许多基于人体目标的高级技术,如异常行为分析、行人追踪等,都直接依赖于人体检测结果的精度,因此人体检测也具有良好的研究价值。 现有的基于彩色图像的人体检测技术经过几十年的发展,取得了丰富的研究成果,但其检测精度和检测速度很难进一步提高。首先,从数字图像中提取的人体特征与人体高层语义之间存在着语义鸿沟,现有的特征提取方法对人体特征的刻画能力很难进一步提高;其次,特征的提取需要在图像的多尺度空间进行穷举式搜索,检测算法的时空开销很大;最后,彩色二维图像对场景信息的描述维度有限,并且光线变化等情况会对成像质量造成影响,导致检测精度的额外下降。 随着Kinect的出现,获取廉价且可靠的深度图像成为可能,为人体检测技术的研究带来了新的探索方向。 本文分别基于Kinect采集的深度图像和深度视频,在使用深度信息缩小检测时间和提高检测精度等方面作出尝试。在深度图像上,提出了基于深度信息获取检测窗口算法,能够直接计算检测窗口的位置和大小,避免了在图像的多尺度空间进行穷举搜索。在深度视频上,提出一种结合非参背景建模和深度特征的人体检测算法,该算法通过对运动信息的提取,缩小了需要进行人体检测的区域,并通过改进结果融合过程,提高了检测精度。 本文主要工作如下: 1)结合Kinect深度图人体成像特点,给出了一种基于深度信息直接计算检测窗口的算法。针对某些情况下检测窗口中心出现漂移的情况,提出一种自适应的图像分层算法,对检测窗口中心的计算过程自动进行纠正。相比于滑动窗口方法,基于深度信息快速获取检测窗口算法不需要对目标可能出现的位置进行穷举,大幅减少了生成的检测窗口数量,提高了检测效率。 2)改进了非参核密度估计背景建模方法中的子模型更新方式,通过融合改进后的两个子模型建模结果,提高了建模方法捕捉长时稳定背景的能力。在背景减除的过程中使用改进的建模方法,提取深度视频场景中包含人体目标的各个区域。改进后的算法在深度视频上表现出比在彩色视频上更好的提取效果,对百余帧内无明显动作变化的人体目标也能够无遗漏地提取出来。然后,基于背景减除得到的前景区域,通过深度图与彩色图对齐,实现了联合深度与彩色信息的人体检测。 3)针对人体成像重叠时,结果融合过程中经常出现的错误融合情况,提出一种度量检测结果窗口深度相似性的方法,并根据各窗口的相似性进行结果融合前的预处理。改进后的方法避免了在非极大值抑制过程中只依靠位置信息筛选检测结果,降低了人体检测算法的漏检率。 4)在上述工作的基础上,设计并实现了基于深度信息的人体检测系统,并对本文提出的算法在数据集上的实验统计结果进行了分析和评价。