论文部分内容阅读
二维人体姿态估计就是在包含有人的静态图像中分辨出人体各个部分在图像中的位置、角度及尺度的关系。首先,检测出图像中人体的各个部分,如头、躯干等。然后根据人体各部分的运动学关系,将对应的各候选部分进行最优组合估计出人体的姿态。人体模型可以映射成一个图案结构(Pictorial Structures,简记为PS):每一个顶点表示一个部分;每一条边表示部分与部分之间的关系。在贝叶斯框架下,各个部分作为观测的似然概率,部分之间的关系记为先验,整个姿态估计问题便转变成一个最大后验概率(maximum a posteriori,简记为MAP)问题。姿态估计属于图像分析层次,是理解人体行为的基础,在人工智能方面有着重要的应用,是智能处理的重要课题之一。通过估计人体的姿态,可以理解场景中人的行为并及时做出处理。实际上,由于图像中的背景干扰、人体姿态的复杂程度以及现有检测技术的局限性使得问题的解并不理想。经常会出现‘’Double-Counting "问题,即左半肢和右半肢重叠现象;还会出现"Dismember"问题,即人体的各个部分并不是紧凑地组合在一起。当图像中出现两个人紧挨时,就会混淆各部分的归属。本文提出了一个有效方法,可以实现人体分割和姿态估计的共同优化,以姿态估计引导分割,以分割促进姿态估计。首先,利用Adaboost分类器在图像中各个位置和方向检测各个部分,得到每个部分的评价得分。其次,根据人体的运动学关系,建立各个部分之间的空间位置分布关系。接着,由图像中检测的信息和位置先验,通过sum-product算法进行消息传递,得到各个部分的置信分布。每个部分都选取后验概率最大的N个候选作为采样样本。根据区域位置与关系计算其权重。然后,对图像进行过分割,得到一系列的超像素并计算各个超像素之间的相似性。用原先得到的候选估计出各超像素的前景分布。最后,将人体各部分和各个超像素以及它们的边界关系建立一个线性能量函数,使得人体分割和姿态估计同时达到最优。本文做出的主要贡献总结如下:(1)在传统的滑动窗检测器上,增加了人体各个部分分布信息,得到一个基于PS模型的人体部分检测器,改善了检测效果;(2)提出了一种同时优化分割和姿态估计的方法;(3)改善了Double-Counting和Dismember问题。在公开的图像库(Parsing,包含305副人体全身图,其中100副训练,205副测试;Buffy,包含268副上半身图像)上做的验证性实验,结果表明本文提出的方法是非常有效的。