基于CNN的跨年龄人脸识别在线训练算法设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:magic1136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于深度学习的人脸识别算法取得了长足的发展,依靠其安全可靠和使用便捷的优点,在社会生活中已经得到了广泛应用。但是对于人脸特征库未及时更新带来的年龄跨度较大的人脸识别任务,一般的人脸识别技术遇到了一定的瓶颈。现有的跨年龄人脸识别技术计算复杂,且泛化能力有限,距离部署到移动终端,形成落地应用尚有一段距离。另一方面,因为神经网络的训练需要巨大的计算和存储资源,目前的神经网络模型在服务器训练完成部署到端侧设备后,参数不再改变,这就很难适应复杂多变的真实场景。因此,面向嵌入式移动终端,实现高效的跨年龄人脸识别和在线训练就具有相当强的现实意义。本文基于主流的跨年龄人脸识别技术中的判别式算法,简化了年龄和身份信息分离的处理流程,设计出一种基于线性特征分离的跨年龄识别模型。通过改进轻量级CNN网络,减小了特征提取所需的参数量和计算量;提出“两点表示法”表示年龄向量,提升年龄估计的准确性;使用多任务联合训练,有效地训练特征分离网络;提出适用于移动端在线训练的优化器算法,使得网络模型能够根据真实场景下的数据分布进行在线训练。针对人脸识别算法在移动端部署的需求,将人脸检测模型MTCNN进行8-bit量化,减小了硬件资源的压力;同时针对卷积神经网络自身的特性,对嵌入式程序设计和实现进行了优化,使用图像转列(im2col)和通用矩阵乘(GEMM)加速算法,有效提升了卷积计算效率。最后在嵌入式平台树莓派4B上实现了人脸识别在线训练算法。本文基于特征分离的跨年龄人脸识别算法,参数量仅为1.05M,在三个公开的跨年龄人脸数据集上取得了较为理想的准确率(CALFW-94.10%,MORPH-98.79%,Age DB-94.32%)。同时,本文提出的适用于移动端的人脸识别在线训练的功能,单次遍历CALFW测试集进行真实场景在线训练的仿真可以取得0.1%的精度提升。人脸识别算法在移动平台树莓派4B上实现了11fps的运行速度(人脸检测+识别)。本文的研究对未来高精度快速的跨年龄人脸识别技术,特别是在线学习的最终实现,具有一定的参考价值。
其他文献
随着现代化建设,城市人口逐渐增多,城市规模也随之扩大,不断向城市外延扩展,因而“职住分离”的现象越来越普遍,这不仅增加了人们的通勤时间,拥挤的通勤环境也降低了出行的舒适性。尽管轨道交通、干线公交等大运量快速通行的公共交通布设在城市主要客流走廊上,满足了部分市民日常通勤和生活出行的基本需求。然而,由于轨道交通建设和运营成本较高,其线网密度极低;同时,受到道路宽度、等级的限制,在城市外围存在着一些常规
既有建筑地下增层方兴未艾,其关键工艺是土体开挖和桩基托换。桩基托换中上部荷载逐步转移到新的托换桩梁体系中。桩基托换后需对建筑底层下土体进行开挖,不可避免的造成桩侧和桩端土体的扰动和移除作用,进而造成桩极限承载能力和稳定性的降低,有些情况下桩身会出现负摩阻力,进而影响原有桩基的承载力、差异沉降和稳定性。本文基于理论分析和数值模拟,分析桩侧极限阻力在传统公式法和矩形荷载下Mindlin应力解和数值模拟
应变硅技术是现代半导体的一项关键技术,可以有效提升器件的载流子迁移率以及性能。应变硅技术已大规模应用于先进CMOS工艺中,同时功率半导体器件也可以利用应变硅技术优化导通电阻与击穿电压之间的折中关系,突破“硅极限”。SGT(Shield Gate Trench,屏蔽栅沟槽)MOSFET在分立功率半导体领域具有重要应用,目前研究者大多通过改变SGT MOSFET的结构与工艺来提升电学性能,对应变硅技术
对于处理生物电子信号的系统而言,由于生物电子信号本身幅值变化较大,同时在传播路径中受各种非理想效应的影响,往往需要可变增益放大器对输入信号进行处理,以保证后级电路可以接收到具有稳定幅值的信号。随着数字信号处理技术的快速发展,通过数字信号控制的可编程增益放大器在很多应用中逐渐替代了传统的可变增益放大器,具有良好的应用前景。本文对生物电子信号处理中的多通道宽增益调节范围可编程增益放大器进行了设计与研究
随着现代科技的发展,红外探测技术被广泛的应用于军事和民用领域。红外焦平面阵列(Infrared Focal Plane Array,IRFPA)是红外光电探测系统的重要部分,主要包括红外探测器面阵和读出电路(Readout Integrated Circuit,ROIC)。红外光电探测器负责收集目标的红外辐射,并将光信号转化为电信号,ROIC作为前端处理电路,需要将探测器产生的微弱电流信号进行放大
时钟数据恢复电路(CDR)是Serdes系统的核心模块,而压控振荡器是时钟数据恢复电路的关键模块,因此压控振荡器的功耗在整个系统的功耗中所占比例较大。要求整个锁相环系统符合JESD204B协议,达到12.5Gbps的数据传输速率。CDR电路采用1/4速率,环形压控振荡器实现多相位的输出,频率达到3.125GHz同时满足低功耗水平是研究的重点和难点。论文设计了四级伪差分环形压控振荡器,为了降低功耗并
近些年来,由于电子技术的快速发展和人们生活水平的提高,消费电子产品市场持续火热,全球市场对于开关电源的尤其是反激式变换器的需求日益增加。此外,随着世界能源愈发紧张,人们环保意识显著提高,绿色电源存在着极大的发展潜力。为了适应市场的需求,亟需研究设计一种高效率、低待机功耗的反激式变换器芯片。针对上述的要求,本文从提高电源的转换效率和降低其待机功耗两个方面进行了设计和研究。对于反激式变换器,传统提升转
随着集成电路制造工艺的不断进步,电路尺寸不断缩小,工作电压持续降低,工艺参数波动对电路性能及良率造成的影响愈发难以准确评估。尤其是对于具有数量极多重复单元的SRAM电路而言,为保证芯片的整体良率,每个SRAM单元的失效率必须极低。对于这样的小概率评估问题,传统的蒙特卡洛方法需要耗费很长的时间才能得出良率计算结果。一些常见的基于重要性采样的分析方法通常能够减少所需的样本仿真次数,加快良率评估过程,但
近年来,蓝藻水华频繁暴发仍是太湖最严重的水环境问题之一,而水华暴发的危害之一便是可以产生毒性极强的蓝藻毒素,对水生生物和周边居民的生命财产安全产生严重威胁。其中,微囊藻毒素(MCs)是最为常见且研究最多的一种蓝藻毒素。MCs具有明显的肝脏毒性,能够抑制生物体中蛋白磷酸酶活性,引起内质网氧化应激、DNA损伤和细胞凋亡。在蓝藻水华较为严重的区域,MCs的大量存在势必会对水生生物产生严重的毒害作用,并可
LoRa是一种低功耗广域网(Low Power Wide Area Network,LPWAN)无线通信技术,具有远距离,低功耗与大容量数据传输的通信特点。LoRa采用线性调频扩频技术(Chirp Spread Spectrum,CSS),这种方式虽然增大了通信距离,但会导致数据传输速率降低,有效传输速率仅为0.3kbps-5kbps。在移动设备节点的应用场景下,节点为保证传输可靠性使用较低数据速