基于卷积神经网络的人脸检测算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:tygsfe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着互联网视频和图像数据的海量增长,急需开发出更好的智能系统去自动获取和理解这些视频、图像信息。人脸可以传达一个人的身份和感受,在社交方面起着重要作用。自动人脸检测系统在人脸识别、人脸表情识别、头部姿势估计、人机交互等方面起着重要作用。人脸检测的目的主要是确定一幅图像中人脸的位置和大小,是计算机视觉领域中的一个热门领域。在一定的约束条件下,人脸检测技术已经达到了非常高的性能,但是在无约束条件下,主要指在复杂的自然场景、遮挡、多角度和人脸大尺度范围等条件下,现存的很多算法,单纯地靠改变网络模型结构已经无法满足现实需求。针对上述存在的人脸检测问题,本文分析了人脸检测流程,并基于卷积神经网络提出若干算法,用于提升人脸检测模型的检测精度与速度。文章由以下内容构成:1、本文根据人脸检测流程,提出一种基于多分辨率全卷积神经网络的方法获取人脸候选区域。该方法首先从人脸多尺度角度出发,运用一个多分辨率滑动窗口生成多级分辨率下的人脸热图,根据热图上的局部最热区域得到人脸候选区域,最后将人脸候选区域送入CNN分类网络进行分类,获取人脸位置。2、考虑到多分辨率滑动窗口在生成人脸候选区域时会产生大量冗余计算,本文又提出一种尺度与空间预测网络(SSFN),SSFN是一个轻量的全卷积神经网络,针对图像上存在的人脸尺度范围较大的情况,用该网络预测图像上可能存在的人脸尺度和空间范围,可以有效减少因滑动窗口造成的冗余计算量。3、最后,考虑到基于SSFN的人脸候选区域检测方法,其实际感受野要远小于理论上的感受野,不足以捕捉到全局语义信息,对于从人脸候选区域筛选人脸时会出现的一定程度的误检测问题,本文提出一种基于上下文信息辅助的人脸检测网络,该网络使用深度可分离卷积方法,在不增加额外计算负担的情况下将目标像素周围的局部上下文信息添加至原始特征映射中,并利用全局平均池化方法来添加全局上下文信息,最后将多个上下文信息特征相融合输入至softmax分类回归。在算法实现上,本文采用Caffe来实现深度学习算法框架,在FDDB、LFW和MALF数据集上取得了很好的效果。
其他文献
通过对中美文化创意产业贸易出口总量、出口结构与出口市场的比较,发现中美文化创意产业出口的差距主要体现为结构性差距,包括文化创意产品贸易与服务贸易的结构差距,以及文
本文研究了盐分对真盐生植物和旱生植物种子萌发的影响以及盐生植物种子萌发阶段适应新疆极端盐渍和干旱环境的策略;在野外和室内条件下对真盐生植物和旱生植物渗透调节特性
薄板热塑性翻边成孔加工区别于传统冷翻边成孔工艺方法,是一种绿色环保、无需冷却液加工、翻边后薄板残余应力小和成孔后薄板变形小等优点的加工工艺,该工艺通过凸模与工件的摩擦接触,在旋压进给下摩擦产生热量使工件材料软化进行热塑翻边成孔。冷翻边对预制孔粗糙度要求较高,粗糙度直接影响翻边成孔后的边缘的撕裂缺陷,并且冷翻边后薄板内部残余应力大,影响成孔的机械性能稳定性;热塑性翻边成孔对预制孔的粗糙度要求低,摩擦
生物技术是现在食品科学发展中最具潜力的技术,其中通过基因工程改良植物的果实产量、品质等已经取得了显著成效,而了解植物生长发育的分子机理对更好的利用基因工程获得高品
测定了中国华南6水系及澜沧江(云南勐腊)-湄公河流域(柬埔寨洞里萨湖)的125尾攀鲈(Anabas testudineus)线粒体部分ND2基因1 010 bp序列,分析发现39个变异位点和12个单倍型,总
民俗是社会生活中人们相互认知、理解和沟通的文化指令,包含人们生活中最基本的文化规则。鲁迅的《祝福》既是对旧中国传统妇女不幸遭遇的人生写照,又是对旧中国民俗生活的艺
网络成瘾是一种世界性的心理行为问题,中美比较对于揭示青少年网络成瘾的发生发展机制具有重要价值。比较研究发现,中国青少年网络成瘾的流行率明显高于美国青少年;这一差异
<正> 人口是社会生活的主体,与社会各方面发生不同的联系。具有不同性质、不同类型的人口问题,其研究方法和解决途径也就不同。本文试从社会学的角度探讨人口问题的研究内容
近年来,我国电子商务行业发展迅速,中国已经成为全球第二大电子商务市场。电子商务的发展离不开强大的物流支持,而目前,我国物流行业发展快、规模大,但同时也存在着服务质量
现有军事体能训练模式培养的学员,其身体机能水平已经不能满足新式武器装备对自身的要求。CrossFit是改善军校学员体能训练模式的一种新方法。它通过整合CrossFit训练、功能