基于轻量网络和异质图像融合的实时人脸识别算法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:yuggmacc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着边缘计算设备数量的不断增涨,人脸识别算法不再是只应用于高性能的处理器上,如何在边缘设备上高效可靠地进行人脸识别推理运算成为关注焦点。现有的高精度人脸识别模型都是建立在大型深度卷积网络模型之上的,这种模型需要大量的计算资源,这不利于模型移植到移动和嵌入式设备中。并且在实际场景中人脸识别会受到各种光照条件的影响,而导致识别效果不佳。近红外成像技术可以有效且直接的改善了极端光照条件下的人脸识别性能。由于近红外光谱域人脸数据集的规模都比较小,使得近红外光谱域人脸识别的方法和模型对训练数据往往要求都很高。如何通过大规模地可见光人脸数据集来辅助实现近红外人脸识别,从而实现近红外与可见光匹配的异质人脸识别(Heterogeneous face recognition,HFR),这是异质人脸识别研究中面临的一大挑战。本文对卷积神经网络的轻量化与异质人脸识别展开研究。首先针对人脸识别所用到的深度卷积网络参数量和计算量大的问题,对常见的网络在人脸识别方面的优缺点进行了分析,为了在嵌入式和移动设备上实现高精度的实时人脸识别,本文提出了一种高效的深度卷积神经网络模型Lightfacenet。在网络中结合深度可分离卷积、逐点卷积、瓶颈结构和挤压与激励结构提出了轻量化神经网络单元,使网络在保证有一定准确率的情况下有效地解决深层的神经网络带来的参数冗余和计算量大的问题。再通过改进的非线性激活函数和损失函数进一步提高网络的准确性,该神经网络在保留卷积神经网络部分优点的同时也很好地平衡了网络的缺点。针对近红外图像与人脸库里的可见光图像匹配的异质人脸识别的问题。因为近红外与可见光图像异质人脸数据集的规模比较小,本文提出一种合理的选择与构建近红外光与可见光图像混合的三元组数据集方法,配合本文设计的基于角度特征的三重角度损失函数,对Lightfacenet深度卷积神经网络模型做迁移学习,从而学习近红外光图像和可见光图像之间跨光谱域不变的特征。在同样的实验环境下,Lightfacenet网络既实现了非常高的识别精度,也在模型推理速度上达到实时的效果。在使用MS-Celeb-1M数据集训练后,该模型在LFW数据集上达到了99.50%的准确率,其效果已经可以与现在的大型卷积神经网络媲美。在使用CASIA NIR-VIS 2.0 Face数据集对其进行迁移学习后,Lightfacenet网络模型对于异质人脸图像也有了良好的识别能力。相对于通用的深度学习方法,本方案通过研究轻量级的深度卷积网络,使算法可以在嵌入式设备中高效的运行,提高算法的工业应用价值。对来自两种光谱域(近红外光和可见光)的人脸图像都有很好的识别效果。
其他文献
随着社会发展,生态环境问题日益受到人类重视.近些年来,学者们通过研究基于实际情况建立的生物种群模型,获得生物种群的发展变化规律,所得结果为保护稀有物种,管理生态资源,维护生态平衡提供了关键性策略,具有重要实际意义.本文基于实际建立了几类有脉冲、时滞和扩散等因素影响的生物种群模型,利用脉冲微分方程理论、Mawhin重合度理论、李雅普诺夫泛函和一些分析技巧,研究系统解的存在性、全局吸引性、持久性等动力
知识表示学习(KRL)旨在将知识图谱所包含的实体和关系嵌入进张量表示空间当中,从而在表示空间中完好地保存图谱的语义和结构信息,该技术广泛应用于自动问答、信息检索等各式各样的领域中。然而,先前工作的嵌入式表示学习结果往往是通过同质学习策略所获得的,即在学习过程中平等地对待每个实体和每个关系,从而忽略知识图谱所固有存在的不平衡性与异构性。因此,知识表示学习算法需要针对知识图谱的复杂结构进行改善,算法学
厌氧颗粒污泥具有活性强、结构稳定和沉降性好等特点,不仅能够保持反应器内具有较高的污泥量和良好传质效果,还可促进反应器的快速启动及高效稳定运行。为了快速培养颗粒污泥,本文在自制高传质内循环厌氧反应器中、对接种污泥进行预处理及在高负荷启动、高提升负荷的工艺条件下,研究了反应器启动特性、颗粒污泥形成及特性、颗粒污泥对反应器重新启动的影响、新建乳品废水厌氧反应器启动运行及颗粒污泥的形成,结果表明:1、厌氧
我国煤炭产量位居世界首位,2020年统计数据显示,煤炭原煤产量超过38亿吨,达到38.4亿吨。相比于巨大的煤炭生产量,煤炭需求量却严重不足,产能过剩问题突出。煤炭企业为了抢占市场份额,谋取利润,竞相为客户提供信用政策,即采取赊销的方式结账。一方面,赊销政策是激烈市场竞争中增加销售收入的必要手段;另一方面,随着赊销政策使用频率的激增,应收账款占资产比重与日俱增,把控风险对企业来说越来越重要。因此,如
学位
树木年轮是包括林学、生态学、树木年代学在内的许多学科领域重要研究对象之一,但现有的商业年轮测量与分析软件价格十分昂贵;另一些免费软件缺乏图形用户界面、兼容性差,这
随着科技的发展,智能结构在航天航空的应用越来越广,因其自身阻尼较低的特点,对其在受外干扰下产生的振动进行控制具有非常重大的意义。智能结构是集驱动、传感、控制器及结构一体化的智能系统,特别是压电作为驱动元件的智能结构。智能材料可以对外界的压力,电等物理量的刺激做出响应,使自身发生形变,并把这些作用转换成电能,从而利用这种驱动特性来抑制智能结构的振动。本文以压电陶瓷和柔性悬臂梁结合而成的智能悬臂梁为研
对于视觉语义嵌入这一任务,现有的方法往往以双极化的方式对待查询样本与候选样本之间的相关性。对于模型而言,这些候选样本只能被看作为与查询样本完全相关或者完全不相关。其中,所有的“不相关”候选样本都会在嵌入空间中被以相同的边距均等地推离查询样本,而它们与查询样本之间实际上多样化的相关性则被完全忽略。这一实践忽视了数据之间相对的区分性信息,并且会在检索任务中带来次优的排序结果,以及更差的用户体验。尤其是
近年来,随着移动互联网的迅速发展,电子商务领域也随之获得了前所未有的蓬勃生机,各种大中型电商网站纷纷应运而生。然而网上商城店铺众多并且各色商品种类繁多,鞋类图像数据呈几何式增长,但大量的鞋类图像不能被有效地利用,如何在海量的鞋类图像资源中快速、准确的检索到鞋类图像,成为亟待解决的问题。为此,本文为了解决现有的鞋类图像检索较少地利用语义属性以及检索对象局限于粗粒度导致检索精度较低的问题,提出基于部件
目标检测和跟踪是计算机视觉领域的基本内容和研究热点,随着人工智能的飞速发展,掀起了目标的检测和跟踪技术在不同领域的研究热潮。由于实际应用场景中,通常存在着摄像机抖动、相似目标混淆、光照变化、运动模糊等复杂因素的干扰,为检测跟踪任务带来的巨大困难。目标的检测跟踪通常是在PC机上实现的,随着近几年边缘计算平台性能的提升,特别是基于ARM与FPGA的异构嵌入式系统出现,因其在功耗、体积、成本和实时性上的
本研究采用情绪识别的一致性任务,通过操纵不同社会线索类型和社会线索性别来考察DBD儿童对不同社会线索的编码特点。第一部分通过设置面部表情线索类型(一致性、冲突性)以及线索性别(男性、女性),要求被试在不同的面部表情社会线索条件下对文字内容进行判断。第二部分通过设置肢体动作类型(一致性、冲突性)以及线索性别(男性、女性),要求被试在不同的肢体动作线索条件下对文字内容进行判断。第三部分通过设置语音情绪