论文部分内容阅读
近年来,人脸识别在门禁中得到广泛应用。与此同时,深度学习网络在人脸识别技术上掀起了巨大的浪潮,其模型具有层次性且参数容量大,能将数据特征更好的展现出来。其中深度学习中CNN在图像处理上具有空间位置的旋转、平移和缩放的不变性,在人脸识别中可以避免图像中人脸平移与其他形式的变形对识别的影响,发挥出良好的人脸识别效率,但CNN过拟合是当前面临的一个难题。本文围绕门禁中正面人脸识别,利用Caffe深度学习框架对基于CNN神经网络的人脸检测和识别在有限样本下如何解决网络过拟合和提升识别率进行研究,主要工作如下:(1)针对人脸检测二分类CNN过拟合问题,本文提出该网络中网络优化模块即全连接层改进设计方法,将训练阶段原Dropout随机稀疏的方式改进为按输出值由大到小分为三个等级(前1/3,中间1/3和后1/3),并分别给三个等级设定不同的稀疏度(输出值大的稀疏率低,输出值小的稀疏率高),对该网络测试阶段的全连接层稀疏化处理。基于深度学习Caffe框架,本文利用改进的二分类网络对人脸检测进行实现,用GitHub中训练好的模型结合本文数据对网络进行微调,并将训练好的二分类CNN进行全卷积网络转换,最后运用滑动窗口检测到人脸。(2)本文利用改进的Alexnet多分类CNN结构进行人脸识别。首先,对该网络采用不同的激励函数,分析不同激励函数对网络性能的影响。接着,针对人脸识别Alexnet网络参数多,容易导致网络过拟合,影响人脸识别率的问题,对Alexnet网络结构改进使网络参数轻量化,提高识别率。本文设计方案为:去掉网络中参数量最大的一个全连接层,对原11x11卷积核大小的Convl1纵向拆分成7x7和5x5卷积核大小的两层,对原5x5卷积核大小的Conv12层横向拆分成1x1、3x3和5x5卷积核大小的三层。最后,基于Caffe本文利用改进的Alexnet网络对人脸识别进行了实现,将待识别的人脸图片通过人眼对齐,并随机切分成10个以不同坐标起点的样本图片,利用训练的多分类CNN模型进行识别。(3)为了验证文中改进后CNN算法,本文对实验所需的人脸检测和识别算法进行集成,搭建了基于Caffe的CNN人脸识别系统。基于该系统下实验对比,改进后的二分类CNN识别率提升了 2.33%,网络的泛化性得到改善,改进后Alexnet网络参数减少为原来的0.7倍,识别率提高。最后,本文对工作进行了总结,并针对工作中的不足进行了分析和展望。