论文部分内容阅读
人体特征点定位算法是计算机视觉领域中一个非常重要的分支,在人机交互、影音娱乐、美颜相机中具有广泛应用场景。本文研究的人体特征点包括人脸特征点和人体关节点。为了让人体特征点在计算资源有限的设备上准确快速的定位,本文提出了两种基于深度学习的人体特征点定位算法。首先在人脸特征点定位算法中,本文提出基于Inception结构的卷积神经网络代替多级联神经网络结构,有效降低了运算量;为了提升网络的准确率,使用多分支结构增加网络宽度,并引入了残差结构,进而实现人脸特征点的快速准确定位。其次在人体姿态估计算法中,本文将深度可分离卷积与沙漏型网络结构相结合,这种组合方式能够极大降低网络的参数量,从而提升人体姿态估计的速度。为了减少空间信息的损失,本文使用热力图作为神经网络的输出,这种结构能够有效提升定位的精度。为提高人脸特征点的定位速度,本文提出一种基于Inception结构的特征点定位方法。该方法取消了传统的多级联结构,采用一个更宽更深的神经网络实现人脸特征点的定位,从而大大提升神经网络的运算速度。为了弥补单个神经网络带来的误差问题,本文设计出一种基于Inception结构的模块。该模块首先使用多个卷积分支对特征图进行卷积操作,然后将多个分支的特征图进行叠加,最后引入残差结构以减少网络梯度弥散现象。改进后的Inception模块对图像的平移、缩放、变形等具有更好的识别性,增加了网络的适应性。经实验证明,该算法在保证特征点定位准确性的同时,对定位速度有一定提升,面对不同姿态和不同环境的人脸时该算法均实现了稳定的定位,具有较高的鲁棒性。为提高人体姿态估计的速度,本文提出一种基于深度可分离卷积的特征点定位算法。该方法将深度可分离卷积与沙漏型网络结构相结合,从而提升网络的定位速度。深度可分离卷积的操作是通过减少网络参数的方式提升定位的速度。沙漏型网络结构通过对特征图分辨率的压缩再上采样,有效降低了网络的运算量。该算法采用热力图作为网络的输出,保存了更多的空间信息,提高网络的泛化能力。实验结果证明,本文研究的人体姿态估计算法在准确度和运算速度上均取得了令人满意的成绩,在不同姿态和环境中具有较高的鲁棒性。