论文部分内容阅读
随着电子设备的广泛普及,人们期待着出现一种更加智能和便捷的交互方式,因此人体姿态估计一直以来都是计算机视觉研究领域的热点问题。本文将重点研究基于静态图像的人体姿态估计方法中存在的不足以及针对这些问题提出相应的解决方案。人体姿态估计方法可以大致分为基于无模型和基于模型的两类方法。首先,现有基于无模型方法的表现往往都依赖于训练样本的规模,因此这类方法往往无法在稀疏训练集下取得令人满意的预测效果。其次,现有的一系列使用深度卷积神经网络的方法虽然能够取得很好的预测结果,但是这类方法产生的网络模型往往都相对较大,不利于移植到有存储空间限制的嵌入式设备之中,同时这类方法往往在训练和测试的过程中都会花费大量的时间。最后,基于模型的方法在解析姿态的过程中,为了处理不同尺度下的估计问题,往往需要借助特征金字塔的帮助,从而会造成很多不必要的重复计算。本文将针对上述问题提出相应的解决方案,主要的贡献如下所示:(1)将局部子空间方法运用于人体姿态估计任务之中,它在稀疏训练样本的情况下仍然能取得不错的预测结果,从而克服了基于无模型的学习方法对样本规模非常敏感的问题。之后通过重新组织误差函数使之成为凸函数从而直接得到相关参数的闭式解,极大地降低了训练过程所消耗的时间,使我们能够根据不同的任务更快地设置最合适的子空间数量和近邻子空间数量。(2)分析了基于卷积姿态机方法在网络结构大小和前向、后向传播速度上存在的不足,使用一种新的模块来替换原网络结构中使用的大尺寸卷积核卷积操作,该模块具备使用有限数量的参数去并行地学习多个尺度特征的能力,更重要的是通过该模块学习到的多尺度特征能够真正帮助我们对各个部件的位置进行有效预测,从而实现模型压缩和提速的目的。(3)分析了基于混合部件模型的方法在解析人体姿态的过程中各部分操作消耗时间的主要因素,然后针对这些主要因素提出了一种基于重要部件的加速解析的方法,该方法利用人体中各个部件之间具有的强关联性通过少数重要部件来降低特征金字塔中分辨率的数量,让原本需要在所有分辨中进行的操作变为只需要在少数被筛选出来的有效分辨率上进行,以此来达到加速解析过程的目的。