基于卷积神经网络的轻量级高精度人脸关键点检测算法

来源 :天津大学 | 被引量 : 0次 | 上传用户:liwulai11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉领域的重要研究方向之一,人脸关键点检测被广泛应用于人脸编辑、人脸姿态估计、人脸重建、疲劳驾驶检测和人脸识别等任务。然而现有的人脸关键点检测算法存在不能同时兼顾检测精度和网络轻量级的问题。为此,本文基于卷积神经网络设计了一种轻量级的人脸关键点检测网络——LFLDNet,并引入知识蒸馏的思想,利用复杂的教师网络指导LFLDNet进行训练,提高了LFLDNet的检测精度;同时提出了一种像素均衡自适应翼形损失函数,克服了常用损失函数因对小误差和大误差不敏感且忽略前景与背景像素的数量差异导致检测精度受限的问题;进一步结合上述方法,在实现人脸关键点检测算法轻量级的同时,有效提高了检测的精度。论文的主要工作如下:1、当前基于卷积神经网络的人脸关键点检测算法网络参数量过大,不利于在内存有限的嵌入式设备上进行部署,针对此问题,设计了一种轻量级人脸关键点检测网络LFLDNet,通过使用小巧而高效的MobileNetV3作为编码器,并使用分组反卷积作为解码器,显著地减少了网络的参数量。2、提出了一种逐像素蒸馏与特征相似蒸馏相结合的检测精度提升方法,通过对齐教师网络与LFLDNet的预测热度图以及两个网络的中间特征图的特征相似矩阵,从而将教师网络学到的知识蒸馏至LFLDNet中,提高LFLDNet的检测精度。在300W和WFLW两个主流数据集上进行了对比实验,结果表明:相较于未采用知识蒸馏的方法,所提出的方法在两个数据集的归一化平均误差分别降低了3.91%和3.15%。3、常用的MSE损失函数对小误差不敏感,L1损失函数对大误差不敏感,并且二者均忽略了前景与背景像素的数量差异,从而影响算法的检测精度,针对此问题,提出了一种像素均衡自适应翼形损失函数,其根据误差大小自适应的调节优化方式,增大了损失函数对小误差和大误差的敏感度,同时其通过增大前景像素在损失函数中的权重,并减小背景像素在损失函数中的权重,实现了前景与背景像素的数量均衡,提高人脸关键点检测算法的检测精度。在300W和WFLW两个主流数据集上进行了对比实验,结果表明:相较于L1损失函数,所提出的损失函数在两个数据集的归一化平均误差分别降低了8.04%和9.94%,相较于MSE损失函数,所提出的损失函数在两个数据集的归一化平均误差分别降低了6.98%和10.14%。
其他文献
随着互联网技术飞速发展,各类在线社交平台应运而生。由于数亿的用户注册量,导致社交平台产生了越来越多富含链接与内容的数据,如文档链接网络、用户交互网络等。这些网络通常被建模为属性网络,其中节点表示对象、边表示对象间的关系、属性表示节点特性。尤其是,属性网络社团的识别对于人们理解和利用网络数据的语义功能具有重要意义。目前,社团发现方法不断涌现,并取得了较好的效果。其中,基于非负矩阵分解、引入节点流行度
S公司是国家电网中从事软件和信息技术服务的典型企业,长期存在多项目并行的情况。随着项目资源冲突的加剧,公司在多项目优先级评价方面的管理需求越来越迫切。目前关于软件和信息技术服务行业多项目优先级评价的研究相对较少,指标体系尚不完善,评价方法虽多样但实用性较低。因此,以S公司为例开展这项研究工作具有一定的理论意义与实用价值。本文主要从指标体系设计、指标赋权设计和评价方法设计三方面入手研究S公司多项目优
癌症已成为威胁人类健康的主要杀手,目前全球50%的消化道癌症发生在中国。消化道癌症早期诊治尤为关键,早期消化道癌诊治五年生存率达90%以上,晚期消化道癌症五年生存率只有10%,然而中国消化道癌症早诊率低、治疗水平差异大,超过85%的消化道癌症患者在确诊时为中晚期。经自然腔道手术(Natural Orifice Transluminal Endoscopic Surgery,NOTES)具有创伤小、
2017年2月,国务院办公厅颁发《关于促进建筑业持续健康发展的意见》(国办发[2017]19号)文件,倡导培育一批具有国际水平的全过程工程咨询企业。政府投资项目应带头推行全过程工程咨询,鼓励非政府投资项目委托全过程工程咨询服务。论文以代理理论为基础,通过调查问卷的方式统计测量数据,并据此描述不同障碍因素对于建设单位推行全过程工程咨询服务的影响程度,提取我国推行全过程工程咨询服务的关键障碍因素。研究
近年来,数据驱动的建模方法已成为非线性系统辨识领域研究的重要课题。与传统理论建模方法相比,数据驱动建模不依赖于先验知识,可以直接从实验或仿真数据集中直接恢复控制方程,特别适用于分析含噪声因素影响的强非线性系统数据集。本文在研究人员近期广泛采用的稀疏辨识非线性动力学算法(SINDy,Sparse Identification Nonlinear Dynamics)基础上,提出两种数据驱动的建模方法。
车辆的平顺性是与车辆动力学有关的主要性能之一。随着人们对健康重视程度的提高以及对舒适性要求的提高,人们对车辆平顺性的要求也越来越高。对于重型卡车而言,其平顺性不仅关系到乘员的健康和舒适,而且会对运输货物的完整性造成影响。因此,建立重型卡车的动力学模型,开展重型卡车平顺性仿真分析与优化设计的工作具有重要的意义。目前整车平顺性仿真分析与优化研究中存在以下几个问题:一是在整车动力学建模过程中,大多将车辆
随机分岔是非线性随机动力学研究的重要问题,是因系统内部或外部因素不确定而导致引起行为发生本质变化的现象。van der Pol方程作为一种典型的非线性自激系统,其非线性特征具有广泛的代表性,对其进行深入研究有助于人们认识和分析具有同类非线性系统的行为机理。目前的研究主要借助于随机平均法和FPK方程的求解理论,以稳态幅值概率密度的解析表达来展开。然而这种方法忽略了相位的影响,难以全面反映系统的随机动
基于叶尖定时原理的叶片振动在线监测系统已成为航空发动机部件和整机实验中叶片振动监测和评价的最有效手段,叶尖定时传感器作为叶片振动在线监测系统的传感元件,安装于发动机机匣上,端部直接与发动机内部气流接触,工作温度范围由风扇级200℃直至涡轮级1300℃。目前常用的叶尖定时传感器主要分为光纤式、电涡流式以及电容式,其中光纤式叶尖定时传感器具有体积小、宽带宽、精度高等优点,具有很好的工程应用价值。但目前
光纤布拉格光栅(Fiber Bragg Grating,FBG)传感在交通运输、能源安全、结构工程等领域有着重要的应用。基于扫频光源的FBG传感解调系统因具有高信噪比、高解调速率等优势被广泛研究。本文研究一种基于循环移频环路的扫频光源,并研究基于此扫频光源的FBG传感解调方法。基于循环移频环路的扫频光源扫频速率快、线性度高、扫频步长精确可控,能有效提高FBG传感解调系统的解调速率、解调线性度和解调
随着机器视觉在智能制造中的广泛应用,复杂工业场景对三维测量系统的精度、鲁棒性等方面提出了更高的要求。线结构光三维测量系统中,视觉传感器标定与中心线提取是影响测量结果的关键技术,因此需要对现有方法存在的问题进行研究并加以解决。针对传统基于二维靶标的视觉传感器标定方法存在鲁棒性较低且无法直接度量精度的问题,引入掩码模板与相机模型对标定过程进行改进,激光平面拟合精度评价结果显示,与传统方法相比,改进后方