论文部分内容阅读
制造出具有人工智能的机器人一直是科学家们的梦想。要实现这一目标关键的一步是识别图像中的物体。物体的骨架不仅包含了物体的形状特征,还具有拓扑结构,所以它在物体识别及相关应用领域,例如基于内容的图像检索、字符识别、生物医学图像分析和监控系统中,是一种有用而且重要的描述符。最近几年,鉴于骨架能方便地描述有关节的物体,所以在人机交互系统和体感游戏中,骨架被广泛用于模拟人体运动姿势。总而言之,研究基于骨架的物体表示和识别能加速计算机视觉领域的发展。本文的工作主要集中在解决基于骨架的识别问题上,包括骨架剪枝,形状分类与聚类和人体姿势修正。本文的主要贡献包括如下几个方面:1.提出一种新的叫做弯曲潜能比率的重要性度量,将其用于骨架剪枝。根据这种重要性度量,一段骨架枝是否该去除取决于它所对应的轮廓段对整个形状的贡献。而同样一段轮廓段处于整个轮廓上不同位置时所表现出的重要程度可能会有所不同,所以判断轮廓段对整个形状的贡献还需考虑其所处位置。同时,通过在骨架生长中结合该重要性度量进行剪枝,以保证剪枝骨架的连通性。实验结果表明,该剪枝算法能去除冗余的骨架枝,并得到适用于形状匹配的精确骨架。2.提出一种新的骨架剪枝算法,它与传统的方法有着本质的不同。它将骨架剪枝问题通过贝叶斯模型抽象成一个骨架简单性和形状重建误差之间的开关问题。形状重建误差通过重建形状与原始形状的面积覆盖程度度量,而形状简单性则反比于骨架长度。一个简单的贪心算法被用来去逼近最大的贝叶斯后验概率,由此定义了一个剪枝顺序,从而得到最终的剪枝骨架。实验表明,在不调节任何参数的情况下,该算法得到的骨架对于物体轮廓变形及类内形状变化依旧是稳定的。3.提出一种基于骨架的形状分类方法。通过有监督学习得到同类形状的骨架联合树,树中的节点包含了样例骨架的接合点以及它们的统计分布。随后,根据贝叶斯准则,这些信息会被用来对新的形状进行分类。在两个知名的形状数据集上的分类精度都要好于其他最先进的形状分类方法,说明了该算法的有效性。4.提出一种基于骨架的方法去解决形状聚类的问题。该方法发掘出一种能表示同类物体固有内在信息的共同结构。一般聚类方法仅仅考虑成对的相似性度量,与之不同,本文提出的聚类方法采用合并型多层次框架,在聚类的同时更新共同结构,并将之用于下一次合并迭代以改进形状间相似度。实验结果表明,该方法能发掘出同类形状的共同结构,同时能自动检测出异常骨架节点,并对参数设置不敏感,且在四个形状数据集上都取得了最好的聚类效果。5.提出一种基于从Kinect深度图像中估计得到的初始人体骨架的姿势修正算法。它显示了基于样例的方法是解决姿势修正问题的一个有效途径,而通过随机森林回归去学习非齐次的系统化误差则是解决问题的关键。采用级联回归和增加运动一致性约束也可以帮助提高姿势修正的结果。实验结果表明,该姿势修正算法,确实可以极大程度地提高姿势识别的精度,并且远好于当前Kinect系统所采用的姿势修正算法的效果。本文所要解决的问题都是计算机视觉领域中的基础问题,所以本文所提出的模型和算法对其他的视觉任务和应用也有积极的推动作用。