基于改进CNN的人脸检测和识别技术研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:yxleicht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人脸识别在门禁中得到广泛应用。与此同时,深度学习网络在人脸识别技术上掀起了巨大的浪潮,其模型具有层次性且参数容量大,能将数据特征更好的展现出来。其中深度学习中CNN在图像处理上具有空间位置的旋转、平移和缩放的不变性,在人脸识别中可以避免图像中人脸平移与其他形式的变形对识别的影响,发挥出良好的人脸识别效率,但CNN过拟合是当前面临的一个难题。本文围绕门禁中正面人脸识别,利用Caffe深度学习框架对基于CNN神经网络的人脸检测和识别在有限样本下如何解决网络过拟合和提升识别率进行研究,主要工作如下:(1)针对人脸检测二分类CNN过拟合问题,本文提出该网络中网络优化模块即全连接层改进设计方法,将训练阶段原Dropout随机稀疏的方式改进为按输出值由大到小分为三个等级(前1/3,中间1/3和后1/3),并分别给三个等级设定不同的稀疏度(输出值大的稀疏率低,输出值小的稀疏率高),对该网络测试阶段的全连接层稀疏化处理。基于深度学习Caffe框架,本文利用改进的二分类网络对人脸检测进行实现,用GitHub中训练好的模型结合本文数据对网络进行微调,并将训练好的二分类CNN进行全卷积网络转换,最后运用滑动窗口检测到人脸。(2)本文利用改进的Alexnet多分类CNN结构进行人脸识别。首先,对该网络采用不同的激励函数,分析不同激励函数对网络性能的影响。接着,针对人脸识别Alexnet网络参数多,容易导致网络过拟合,影响人脸识别率的问题,对Alexnet网络结构改进使网络参数轻量化,提高识别率。本文设计方案为:去掉网络中参数量最大的一个全连接层,对原11x11卷积核大小的Convl1纵向拆分成7x7和5x5卷积核大小的两层,对原5x5卷积核大小的Conv12层横向拆分成1x1、3x3和5x5卷积核大小的三层。最后,基于Caffe本文利用改进的Alexnet网络对人脸识别进行了实现,将待识别的人脸图片通过人眼对齐,并随机切分成10个以不同坐标起点的样本图片,利用训练的多分类CNN模型进行识别。(3)为了验证文中改进后CNN算法,本文对实验所需的人脸检测和识别算法进行集成,搭建了基于Caffe的CNN人脸识别系统。基于该系统下实验对比,改进后的二分类CNN识别率提升了 2.33%,网络的泛化性得到改善,改进后Alexnet网络参数减少为原来的0.7倍,识别率提高。最后,本文对工作进行了总结,并针对工作中的不足进行了分析和展望。
其他文献
目的探讨颈椎全麻术后患者首次饮水、进食的适宜时间。方法选择2011年1月~2013年12月在我科行颈椎手术的829例全麻术后患者作为研究对象,排除上颈髓损伤、生命体征不稳定、术
毫无疑问,成功的企业必须获得持续发展所需的赢利,但是仅仅是一家能赚钱的公司不足以做到基业长青,如果想建立一家伟大的公司,成为引领行业前行的旗帜性企业,就必须要有超越利润的
<正> 近两年来,县级的外向型经济正以惊人的速度突飞猛进,在外资企业的数量、外贸出口收购的增幅等方面都有很大发展。但是离外向型经济发展目标还有一定差距,还有待作出更大
江西竹产工业的现状、问题及对策黄宇村竹业工业发展的目标,是加速培育和扩大并合理地利用竹类资源,最大限度地提高竹材的综合经济效益.为了实现这一目标,作为我国主要竹材产区的
区域间农民收入差异与产业结构关系实证分析──以抚州地区为例危巧娟近几年来,随着农村经济的发展,农民收入水平亦有较快增长,抚州地区1993年人均收入达915.40元,比上年增加89.450元,为增收最多的
设立政策性银行与商业性银行,是金融体制改革的一个重要内容。肖小和《对专业银行政策性业务和经营性业务划分问题的思考》就如何划分业务问题,提出“分帐制是划分两类业务的
目的 对肝癌患者雄激素受体的测定及其与临床病理特征关系的研究。方法 应用放射配体结合分析法(RBA)测定36例行手术治疗的肝癌组织、癌周组及外周血白细胞雄激素受体(AR)的含量,
《义务教育数学课程标准(2011版)》把&#39;数感&#39;摆在十个核心概念的首要位置,表明了发展学生数感、提升学生数学素养的重要性。小学阶段的学生年龄小,思维习惯和情感态度
日前,CST推出了带有综合完整控制系统的Motomate无刷电机,其一体化设计可在很大程度上节约客户的时间和成本,该产品把一个无刷电机、运动和位置控制系统以及完整的逻辑控制功能
从产品合格率谈企业观念的变革叶厚元产品质量的高低,不仅是评价一个企业的技术水平和管理水平的重要经济指标,而且是衡量一个国家的生产发展水平、科技水平和经济水平的重要标