论文部分内容阅读
人与机器人自然交互在现实应用中具有重要的研究价值,而人脸是人机交互过程中最具个性特征的部位,人脸检测和跟踪是人与机器人交互中的关键技术,在实际应用场景中由于光线强弱、遮挡、旋转、尺度变化等因素使人脸的检测和跟踪带来挑战,本研究主要针对非限定条件下人脸检测和跟踪的多种算法进行对比研究并改进,使改进后的算法更适应不同条件的人脸检测和跟踪任务。
首先,本课题就国内外人脸检测和跟踪算法研究现状进行调研,然后,就目前取得先进水平的基于深度学习的人脸检测算法进行对比实验,混合分辨率(hybrid-resolution,HR)算法着重针对人脸多尺度问题,创建一个图像金字塔分别训练不同检测器,提高了小人脸的检测精确度。由于在深度模型中,数据集对视觉任务的性能有很大的影响,本课题将原来的模型训练数据量加大约16倍,发现我们的新模型用更少的训练轮数下,用于检测后人脸跟踪精度提升约2%。
由于深度学习的方法在人脸识别、检测等任务中运用较多而且取得了领先水平,而在跟踪领域基于深度学习方法的研究较少,本课题着重对比分析了传统目标跟踪算法和基于深度学习的方法优缺点,提出一种基于深度学习的人脸跟踪算法。由于目前还没有公开标注的用于人脸跟踪任务的大量数据集,本研究中将用于人脸验证的大量有监督数据集Youtube Faces用于人脸跟踪任务模型的训练,同时手工标注了不同背景下的人脸跟踪测试集,实验结果表明使用与视觉任务相关的数据集对跟踪的性能有较大提升。
此外,原Siamese-Net算法在目标特征提取阶段采用AlexNet卷积层,而该卷积神经网络的卷积核较大,在分类检测任务的研究中已有成果证明VGG16网络相对于AlexNet更有利于视觉任务的性能提升,本研究通过实验对比分析采用VGG16模型的不同卷积层数对人脸跟踪性能的影响,实验结果表明采用VGG16卷积层作为人脸跟踪任务特征提取器能提高人脸跟踪的性能同时采用2层卷积层性能最佳。同时本研究通过多次实验选取了相对较优参数。
最后,由于原Siamese-Net算法只能进行单人脸跟踪,本课题针对实际应用对多人脸跟踪的需求,结合改进HR算法和改进Siamese-Net算法实现了多人脸自动检测和跟踪系统,在多人脸测试集上取得鲁棒效果。
首先,本课题就国内外人脸检测和跟踪算法研究现状进行调研,然后,就目前取得先进水平的基于深度学习的人脸检测算法进行对比实验,混合分辨率(hybrid-resolution,HR)算法着重针对人脸多尺度问题,创建一个图像金字塔分别训练不同检测器,提高了小人脸的检测精确度。由于在深度模型中,数据集对视觉任务的性能有很大的影响,本课题将原来的模型训练数据量加大约16倍,发现我们的新模型用更少的训练轮数下,用于检测后人脸跟踪精度提升约2%。
由于深度学习的方法在人脸识别、检测等任务中运用较多而且取得了领先水平,而在跟踪领域基于深度学习方法的研究较少,本课题着重对比分析了传统目标跟踪算法和基于深度学习的方法优缺点,提出一种基于深度学习的人脸跟踪算法。由于目前还没有公开标注的用于人脸跟踪任务的大量数据集,本研究中将用于人脸验证的大量有监督数据集Youtube Faces用于人脸跟踪任务模型的训练,同时手工标注了不同背景下的人脸跟踪测试集,实验结果表明使用与视觉任务相关的数据集对跟踪的性能有较大提升。
此外,原Siamese-Net算法在目标特征提取阶段采用AlexNet卷积层,而该卷积神经网络的卷积核较大,在分类检测任务的研究中已有成果证明VGG16网络相对于AlexNet更有利于视觉任务的性能提升,本研究通过实验对比分析采用VGG16模型的不同卷积层数对人脸跟踪性能的影响,实验结果表明采用VGG16卷积层作为人脸跟踪任务特征提取器能提高人脸跟踪的性能同时采用2层卷积层性能最佳。同时本研究通过多次实验选取了相对较优参数。
最后,由于原Siamese-Net算法只能进行单人脸跟踪,本课题针对实际应用对多人脸跟踪的需求,结合改进HR算法和改进Siamese-Net算法实现了多人脸自动检测和跟踪系统,在多人脸测试集上取得鲁棒效果。