基于深度学习的加速多姿态人脸识别算法的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:jshajhb1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪,计算机科学的取得了飞跃式发展,人工智能技术是继物联网、云计算、大数据之后又一个里程碑式的发展阶段,目前人工智能已经被应用到计算机科学的各个领域如语言识别、图像识别、自然语言处理和专家系统等。人脸识别具有开放性、主动性、稳定性等特点,具有广泛的应用前景,因此越来越受到专家学者的重视。但是,目前的人脸识别技术受视频图像采集所处的天气、光照等环境因素,待识别对象的面部表情、姿态、遮挡等人为因素的影响,人脸识别的准确性明显下降,距离开放、不可控、非配合的实际应用场景还有很大距离。其中姿态变化具有非线性特点,传统的模式识别模型或浅层神经网络模型无法解决复杂的、非线性的分类问题,是目前人脸识别的一大难题。深度学习能够逐层提取特征,其不断抽象化概念化的过程与人脑的工作机理非常相似,而这种工作机理上的相似也使得深度学习能够更好的解决姿态变化带来的非线性问题。本文以人脸识别模型为例,对设计移动端低功耗、高性能、少存储的深度学习算法进行研究。因此本文的研究内容及论文创新主要包括以下几点:1)本文提出包含两个独立卷积神经网络的改进人脸识别模型,两个神经网络的卷积核大小不相同,来提取不同粒度的人脸特征。另外为了仿生人眼在在识别过程中自觉提取不同层次特征的功能,将各池化层的输出特征图作为全连接层的输入。为了减少光照、人脸平面旋转对图像识别准确率的影响,本文对人脸输入图像采用PCA和Gabor变换对人脸图像进行平面旋转姿态校正和特征提取。2)针对深度神经网络模型功耗大、存储大、运算慢的问题本文首先从算法角度出发、采用模型剪枝、层级融合等方法压缩网络模型,在较小的准确率损失的情况下模型压缩了4.5倍。大大减少了模型的存储空间和运算量。3)针对当前市场上基于网络API接口的智能应用易受使用环境的网络状态影响,并且针对深度学习加速优化的硬件平台目前大多数处于研发阶段,本文提出了通过手机端GPU加速基于深度卷积神经网络的人脸识别算法。本文采用跨平台的GPU并行软件框架OpenCL设计人脸识别并行算法。本文在保证结果精度的前提下算法加速了51.88倍。加速后的移动端人脸识别算法耗时248.17ms,基本满足实时人脸识别的要求。
其他文献
提出了一种基于角度量测统计特性差异的雷达距离多假目标欺骗干扰识别方法。首先针对传统的角度量测卡方检验方法容易将相同角度分辨单元内的多个真实目标误判为距离多假目标
为发挥学生在教学过程中的主体作用,以及老师在课堂设计的主导作用,提高遗传学的教学质量,本文采用TBL的教学模式,以任务式学习和任务式教学的方式,结合微信公众号的平台对遗
互联网金融企业凭借其成本低、高效快捷、覆盖面广等优势在最近几年得到了较好发展,为传统小微企业解决融资难的问题带来了新思路。鉴于互联网金融企业的发展特点,我国迫切需
<正>关于红军长征的伟大历史意义,在中央红军到达陕北胜利结束长征以后,毛泽东在《论反对日本帝国主义的策略》一文中评价道:"长征是历史纪录上的第一次,长征是宣言书,长征是
目的评价超声造影(Hycosy)在不孕症女性输卵管通畅性的诊断价值并与X线碘油造影(HSG)进行比较。方法电子检索PubMed、Web of Science、中国期刊全文数据库(CNKI)、万方数据库
在车辆传动领域,高功率密度、大排量的液压泵仍然处于不可替代的地位,但对液压泵的性能要求越来越高,而液压泵中的接触副的摩擦磨损造成容积效率和使用寿命降低一直没有得到很好的解决。基于这种背景,本文以高功率密度球活塞式液压泵新型锥形配流副为研究对象,对其工作状态展开理论与试验研究。锥形配流副是一种兼具端面配流及圆柱形轴配流优点的新型配流副,根据其工作原理,结构上宜采用高压口上下对置、低压口左右对置的方案
辉煌灿烂的中国陶瓷艺术,是人类文明史上一颗璀璨的明珠。中国的陶瓷文化之所以源远流长,在于历代陶瓷艺术者的不断创新,除了原料、烧制方法等方面的发展,装饰技法的创新也逐
党的十八届四中全会提出"加强对政府内部权力的制约",要求"强化内部控制,防止权力滥用",将政府部门内部控制纳入依法治国的重要内容。为深入贯彻依法治国方针、强化权力制衡
近年来,随着我国高等教育的不断普及,以及国家对于高校教育的进一步重视,越来越多的学生以及学生家长对于高校各方面素质提出了更多、更高的要求,以满足在校学生的健康成长。
频率捷变雷达综合测试仪是测试频率捷变体制导引头性能的重要仪器,针对现有技术无法直接对其动态频率跟踪性能进行检定的现状,采用了系统设计的方法解决该问题。对捷变频测试