论文部分内容阅读
随着计算机视觉的不断发展,人脸检测和识别技术已经趋于成熟并且被广泛应用。作为人脸的重要属性,年龄估计吸引了越来越多人的关注,是目前模式识别和机器学习领域的一个研究热点,有很大的潜在价值,可以广泛应用在安全控制、人机交互等领域。本文主要进行人脸年龄分类问题的研究,即预测人脸图像所属的年龄范围。目前的大多数方法使用传统的手工设计的特征来描述年龄信息,而这些低维的特征往往不充分,为了获取更有效的年龄特征,本文采用卷积神经网络来作为分类模型。首先提出了基于卷积神经网络的人脸年龄分类模型。近年来,深度学习得到了飞速的发展,卷积神经网络作为其中的一种重要模型,可以直接以图像像素级作为输入,并且能更好的从局部信息块中提取特征,这些特点使卷积神经网络在计算机视觉尤其是图像处理中倍受青睐。所以,针对年龄分类问题构建了一个八层的卷积神经网络。并且针对年龄类别之间的有序性,对损失函数进行了改进,在原有的交叉熵函数的基础上额外加入了一项距离项,使得当预测类别与真实类别距离越远时,损失值越大。除此之外,使用了Dropout技术、Batch Normalization归一化和ReLU激活函数等当前被证明有效的方法来训练网络。最后,在年龄数据集Group中进行了实验,证明了卷积神经网络分类模型要优于传统的基于手工特征提取的方法。其次提出了基于集成卷积神经网络的人脸年龄分类模型。集成学习作为机器学习领域的一大利器,可以有效的改善模型的泛化能力。针对上述卷积神经网络模型存在的泛化能力不足的问题,进一步提出了基于集成卷积神经网络的年龄分类模型,将三个结构基本相同、输入不同的卷积网络进行加权集成,集成的结果作为最终的分类结果。三个网络的输入分别是灰度图像、直方图均衡化后的图像、使用局部二值模式(Local Binary Pattern,LBP)提取的纹理特征。这三个神经网络起到了互相补充的作用,使用原始灰度图充分保留了人脸面部的信息;经过直方图均衡化处理的图像比原图像对比度更强,且更清晰;最后考虑到皱纹信息对年龄分类的重要性,所以加入了LBP纹理特征的分类结果。通过实验证明这种集成模型有效的提高了年龄分类的准确率和泛化能力。