论文部分内容阅读
随着深度学习的广泛应用,人体姿态估计成为动作识别领域的重要研究方向。为了解决人体姿态估计的准确率低以及目标的多尺度问题,提出了一种基于改进R-FCN(Region-based Fully Convolutional Networks)与语义分割相结合的人体姿态估计模型。首先针对模型的主体网络部分,采用ResNeXt-101深度学习网络替换R-FCN原有的ResNet-101基础网络,使得减少超参数的数量,从而提高准确率。然后针对候选区域结构,结合了一种多尺度RPN(Region Proposals