基于深度学习的口罩遮挡人脸识别算法研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:kampfing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的不断发展,人脸识别技术也愈加趋于成熟。人脸识别是指利用人的脸部特征推断其身份的一种生物识别技术。但在新型冠状病毒的肆虐下,人们戴起了口罩防疫,而口罩的遮挡却给人脸识别带来了巨大的挑战。口罩的存在遮住了人脸一半以上的特征,造成了巨大的信息损失,导致现有人脸识别算法表现大幅度下降。因此,为了减少口罩遮挡对人脸识别的影响,本文提出结合人脸修复的人脸识别算法。本文主要贡献如下:针对口罩遮挡区域信息丢失,本文提出一种基于多模态的两阶段人脸修复算法,恢复被口罩遮挡的特征。该算法利用原始图片、人脸几何信息、人脸属性信息三方面模态进行融合,并将融合向量输入到两阶段人脸修复网络。该网络第一阶段生成粗略的修复结果,第二阶段生成更为精细的最终修复结果。并在本文制作的口罩遮挡Celeb A数据集上,采用结构相似性(SSIM)和峰值信噪比(PSNR)两个指标进行评估。实验证明,该算法相对于其他人脸修复算法取得了更好的修复效果。为了更加合理地利用真实未被口罩遮挡区域和修复的口罩遮挡区域,本文提出基于多注意力机制的人脸识别算法。该算法利用空间域注意力、通道域注意力及全局注意力,以便人脸识别算法能够将真实的未遮挡区域特征作为重点。在本文制作的口罩遮挡LFW数据集上,采用人脸识别准确率指标。实验证明,仅采用多注意力机制的人脸识别算法相比较其他较好的人脸识别算法提高了4.56%;结合使用修复算法,相对于其他人脸识别算法提高了5.87%。目前可用的口罩遮挡数据集较少,本文利用人脸关键点检测技术在公开的人脸数据集上制作了一批口罩遮挡人脸数据集,为算法训练提供数据基础。此外,基于本文提出的人脸修复算法和多注意力人脸识别算法,设计了一套口罩遮挡人脸识别系统,该系统主要有口罩遮挡人脸修复、口罩遮挡人脸识别、人脸库管理及系统管理等功能。通过测试表明,本文提出的算法在实际应用中仍有好的表现。
其他文献
随着我国经济由快速发展转为高质量发展,商贸流通业逐渐向规模化、信息化、便捷化和国际化方向发展,商贸物流服务也日趋专业化。专业市场与物流之间的互动发展,逐步带动了主要服务于商贸流通业的商贸服务型物流园区发展建设。作为近年来我国重点建设的物流园区类型,构建高效多元的经营发展模式在提高商贸流通业、降低物流成本上发挥至关重要的作用。而现阶段商贸服务型物流园区虽发展迅速但仍存在许多问题,缺乏相关较为成熟的理
场景图生成是计算机视觉领域的重要研究方向,很多的研究学者不断探索和研究针对图像深度理解领域中的问题。为了加深对图像理解的研究,在目标识别、图像字幕、视觉问答以及自然语言处理等研究基础下,场景图生成任务逐渐成为一个当前计算机视觉领域和自然语言处理相结合的热点研究课题。场景图生成任务要求丰富而高级的语义理解,这对机器来说是一个巨大的挑战。为了提升场景图生成模型的质量,本文针对场景信息利用不充分和在数据
随着城市化阶段的快速发展,城市土地扩张吸引了大量人口,带动了交通设施的建设规模,城市交通展现出出行需求快速增长的特征,而高速的发展和与日俱增的交通需求极易出现供需不平衡现象,造成交通拥堵、环境污染等城市交通病。因此在交通治理问题中,人们需要更加注重交通系统内部的协调,同时抓住信息化时代城市交通发展的新机遇,用信息化手段分析挖掘居民的出行特征。交通出行方式的识别是居民出行研究内容的一部分,在以GPS
在新冠疫情和直播行业竞争日益激烈的大背景下,差异化、垂直领域成为了主流直播厂商的核心战略。作者所在的字节跳动直播团队在2020年初开始发力音频类直播,直播K歌作为一种教育成本低、受众广的模式由此诞生。从产品功能的角度来看,本文所提到的直播K歌/KTV歌房系统中,包含9个业务功能,分别为直播K歌资源管理功能、直播K歌歌曲管理功能、直播K歌歌曲演唱功能、直播K歌音效功能、直播K歌听歌功能、KTV歌房资
随着我国货物运输结构调整的稳步推进和铁路货物运输能力的逐步释放,铁路集装箱运输逐渐凸显出铁路运输和集装箱运输的双重优势,愈发受到中国国家铁路集团有限公司的重视。现阶段国内主流铁路集装箱型为20英尺国际标准集装箱,但该箱型在我国内陆地区流通时存在较严重的容积和载重能力浪费,因此20英尺35吨通用集装箱被开发并投入市场,相比于20英尺国际标准集装箱,20英尺35吨通用集装箱具有能够充分利用箱体容积和载
铁是人体内重要的微量元素,也是人体生理环境中最丰富的过渡金属元素。Fe3+和Fe2+在人体的生物过程中起着重要作用,当人体摄入铁离子过多或缺乏时会导致各种疾病。因此,高效、便捷对Fe3+和Fe2+进行选择性识别与检测,具有重要意义。使用荧光探针是一种非常简单有效的金属离子识别方法。含四苯乙烯结构单元的荧光探针,由于具有聚集诱导发光效应而被广泛应用于金属离子的识别当中。本文以四苯基乙烯为原料,设计并
为了应对国外对我国能源的限制,国家大力推动电动汽车的发展,同时大批量的车用动力电池逐渐淘汰,车用动力电池退役后仍然具有大约80%左右的容量,将其筛选分类后可用于对电池性能要求不高的其他领域,可以最大化锂离子电池的全生命周期价值。锂离子电池应用场景广泛,导致退役电池出现较大的不一致性,直接成组使用会造成一定程度上的安全问题。本文以梯次利用电池的筛选与筛选后梯次利用电池的综合性能评估方法为研究内容,主
简历大多以非结构化文本的形式存在,且数量众多。从此类简历文本中准确提取结构化信息,具有广泛的用途,可以为信息检索、关联分析、数据匹配等诸多上游应用提供基础。简历信息抽取方法大多基于规则和模版的方式,通过人工定制规则对特定的信息进行抽取。在大数据量情况下,此类方法存在成本高、效率低、灵活性差等问题。基于传统机器学习的方法虽然可以一定程度上减少人工成本,但过于依赖特征工程。本文针对这些问题进行研究,采
智商是衡量个体认知能力的重要指标,与大脑功能密切相关,其客观有效的度量不仅具有科学意义,还具有一定的实用价值。静息态磁共振成像(f MRI)技术根据血氧水平依赖(BOLD)信号来获取大脑自发活动,其无创性、时间和空间分辨率高以及不同样本之间的可比性使得该技术在脑功能研究领域得以广泛应用。随着机器学习技术的进步,基于静息态f MRI客观测定智商成为了领域内的热点课题。基于静息态f MRI的智商客观预
根据道路交通事故统计年报数据显示,2019年我国累计发生交通事故超过24万起,国内交通安全形势仍然比较严峻。目前,针对交通事故频次的研究多集中在微观和中观层面,较少从宏观尤其缺少从城市群层面研究交通事故数及其影响因素。本文利用京津冀城市群区域的违章数据,以京津冀各区县为空间分析单元,分析超速和酒驾违章频次的时空分布特征;构建超速和酒驾违章频次的传统负二项和时空效应模型,分析超速和酒驾违章频次的显著