论文部分内容阅读
人体姿态估计通过对图像或视频信息中的人体进行关节点检测进而得到具体姿态,是很多人机交互任务的基础。在智能安全驾驶领域驾驶员姿态估计技术具有广泛的应用前景,本文针对驾驶室内的环境复杂的问题,设计了两个基于卷积神经网络的驾驶员姿态估计算法,主要内容如下:针对驾驶室内常见的光照变化和背景中人体相似部件等因素对驾驶员姿态估计精度造成的影响,提出FCNf网络模型。该网络可以同时对人体关节点和关节点之间的部分亲和域进行检测,然后利用Part Affinity Fields(PAFs)算法对检测到的关节点和亲和域进行匹配与连接。由于目前没有公开的针对驾驶场景的数据集,本文构建车载数据集(Dataset for the Driver’s Driving Situation,DDS),并采用与COCO数据集一致的评估标准。在COCO数据集和DDS数据集上与其他先进算法进行对比,实验结果表明,FCNf在COCO数据集上比原有算法的mAP提升了近3%,在DDS数据集上mAP达到72.4%,并且能够避免肢干漏检测和在非目标区域发生的关节点的误判问题。为了避免非目标区域对关节点检测结果的影响,提出TransformatedHourglass RMPE Network模型,先进行人体检测,然后在人体检测区域内进行人体姿态估计。该模型使用两个阶段的Transformated-Hourglass Network实现特征检测由粗糙到精细的过程并采用跨阶段融合多尺度特征的策略,使特征图包含更为丰富的空间信息。最后通过设计实验验证策略有效性,与其他主流方法在DDS数据集上进行对比实验,Transformated-Hourglass Network的mAP达到87.4%,相对于其他算法在驾驶室的复杂环境中表现更好。该论文有图29幅,表7个,参考文献55篇。