【摘 要】
:
人脸识别技术是计算机视觉领域的典型应用之一。伴随着深度学习特别是卷积神经网络的发展,人脸识别技术在静态图像的识别方面已经取得突飞猛进的进步,然而动态图像人脸识别和视频流的人脸识别依然面临着很多困难,被检测到的人脸往往会受到拍摄角度、位置、光照、低分辨率图像等多因素的影响,给后续的人脸识别带来极大的困难。动态的人脸识别技术在安防监控、侦查破案、智慧城市等领域应用广泛,因此具有很高的研究价值。针对以上
论文部分内容阅读
人脸识别技术是计算机视觉领域的典型应用之一。伴随着深度学习特别是卷积神经网络的发展,人脸识别技术在静态图像的识别方面已经取得突飞猛进的进步,然而动态图像人脸识别和视频流的人脸识别依然面临着很多困难,被检测到的人脸往往会受到拍摄角度、位置、光照、低分辨率图像等多因素的影响,给后续的人脸识别带来极大的困难。动态的人脸识别技术在安防监控、侦查破案、智慧城市等领域应用广泛,因此具有很高的研究价值。针对以上问题,本文通过使用深度学习的方法完成人脸识别研究,并将人脸识别与具体应用场景相结合。本文的研究内容如下:设计并实现了基于MTCNN网络的动态人脸检测算法,与传统的VJ人脸算法相比,MTCNN人脸检测算法在检测角度、姿态、多人脸检测等情况下的检测效果优于VJ人脸检测算法。MTCNN人脸检测算法是一个三层级联框架的人脸检测网络,缺乏跟踪结构,仅在普通PC的CPU运行环境下实时性较差,针对上述问题,设计了基于Camshift的改进算法实现人脸跟踪检测,将MTCNN检测到的人脸框作为Camshift跟踪算法搜索窗口位置和大小的初始化,在原始的Camshift算法中加入人脸形态约束和卡尔曼滤波来解决相近色干扰和运动目标的跟踪问题。实验表明,将改进后的Camshift跟踪算法与MTCNN人脸检测算法相结合后,帧率约为56 FPS,满足实时性要求。设计并实现了基于Inception-Res Net v1的人脸识别网络和基于Mobile Net v3的口罩识别网络。将MTCNN人脸检测算法得到的人脸图像进行缩放,紧接着通过双眼旋转变换法和仿射变换对检测到人脸图像进行对齐操作,为后续Inception-Res Net v1网络提取人脸特征提供基础。建立人脸识别数据库,通过摄像头采集人脸图像进行缩放、对齐和数据库比对之后,得到识别结果,完成人脸识别的流程。口罩识别是人脸识别的应用场景之一,使用Mobile Net v3网络完成口罩的检测识别问题,将采集到的佩戴口罩人脸图像与未佩戴口罩的人脸图像进行人脸检测和对齐,并在此基础构建口罩识别的数据集,使用Mobile Net v3网络完成模型的训练与识别,实验表明,口罩识别准确率在98%以上。在Pycharm开发环境和PyQt5设计软件界面下,同时结合Keras、Tensor Flow深度学习框架和Open CV视觉库搭建人脸检测与识别系统,整个系统包括3个模块:人脸检测、人脸识别和口罩识别。实验验证表明,整个人脸检测和识别系统能够完成人脸检测、人脸识别和口罩识别的功能。
其他文献
安徽省农村商业银行是在原农村信用社的基础上改制而成,经中国银监会批准而成立的地方性股份制金融机构。安徽省农商行始终以为“三农”服务为宗旨,坚定贯彻执行上级有关农村
重力的正反演问题是解释重力勘探资料的核心内容之一,深度学习近年来发展迅猛,在诸多学科领域取得很大成果,其在地球物理领域地震勘探解释反演等多有应用,研究深度学习应用于重力正反演具有开创性意义。深度学习作为一种机器学习方法,需要大量的数据,手动去创建数以万计的重力模型不太现实,观察到公开数据集MNIST数据集与重力模型的相似性,故在深度学习正演计算中,把MNIST数据集作为重力模型,作为深度学习的训练
藏文作为藏族人民在政治、经济、文化和宗教活动中的文字承载工具,在中华民族历史文化发展长河中形成了独特的文字形式,并流传下来大量藏文经典文献。这些经典文献以金石铭文、竹木简牍以及早期写卷等这些原始方式传承至今,最大特色是拥有风格多样的雕刻字体,独特的雕刻方式和构造赋予其极致的文字美感,充分表现了不同历史文化背景下对雕刻字体的美学理解和文字背后的宗教精神。目前对这些善本的再生保存方式有两种,第一种方式
汉字学习是对外汉语教学中的重要部分,但由于文化背景和文字之间的巨大差异,汉字成了印尼学生学习汉语过程中的难点和易错点。本文在已有研究成果的基础上,重点关注处于汉语学习初级阶段和中级阶段的印尼高中生在汉字书写过程中出现的书写偏误。本文以印尼雅加达崇德三语学校高中部的学生为调查对象,通过对他们的汉字书写偏误进行调查分析,将印尼高中生的汉字书写偏误分为笔画偏误、笔顺偏误、部件偏误和整字偏误四大类,并对各
在计算机视觉领域中,人体动作的识别受到越来越多的人的关注,成为了近些年来工程界和学术界的研究热点之一。在现阶段,大部分的人体动作识别任务通常都是利用光学设备如摄像头等设备所获取的信息作为信息源,在此基础上进行研究。然而,这些光学设备往往都会受制于自然环境等因素,如光照、温度等;同时,设备的不同的视角也会带来一定的干扰,从而给识别任务带来了一定困扰。利用雷达信号则能够较好的避免这些干扰因素,因此雷达
血管介入手术机器人可以辅助医生以更加高效,更加安全的方式完成血管介入手术,而且还能保护医生免受X-射线的伤害。目前的血管介入手术机器人研究中,仍然存在着缺乏导管导丝
随着信息科技的快速发展,控制科学在数学、物理,工程、生物、计算机等领域取得了重大进展,也带来了新的发展机遇。复杂网络下多智能体系统的协同控制是数学和工程控制等多个学科的交叉研究热点,旨在研究与分析网络拓扑结构下多智能体系统的群集行为,得到了越来越多科研人员的关注,具有重要的理论研究与实际应用价值。本文在不确定合作竞争网络的前提下,考虑了具有网络不确定性的异质多智能体系统群集行为,分别针对一阶异质多
制造业是国家的支柱性产业,是实体经济发展的关键。中国多次在会议上提出要加强建设新时代制造强国,加快发展先进制造业,支持传统产业优化升级。但是中国制造业目前的器械设备的大部分技术依靠从国外引进,原创性产品和技术极少,企业又不能很好的处理引进和自主创新之间的关系,缺乏创新型人才,创新行为还是只停留在模仿阶段。对制造业企业而言,如果想要获得可持续的发展优势,必须要将更多的资金投入到创新活动中去,要不断提
综合教材课后写作练习的目标是在密切联系课文的基础上训练写作能力,同时兼顾其他语言技能的训练。它与写作教材的写作练习之间既有联系又有区别。本文以《发展汉语(第二版)》初、中综合教材课后写作练习作为研究对象,使用文献研究法、定量研究法和调查法等对写作题型和写作训练要素进行考察。本文对写作题型的研究分为设计与分布两个方面,通过考察发现写作练习题型比较多样,但分布不均衡;题型的任务复杂度整体上遵循循序渐进
结构健康监测系统通过对系统采集的特征信息的分析,判断结构当前的状态,常应用于建筑结构、机械工程领域中。其中,结构损伤识别系统是结构健康监测系统中核心的组成部分。利用人工神经网络实现结构的损伤识别,可以快速高效的对传感器采集的信息进行处理、分析,且伴随着相关技术的发展,有望实现对结构状态进行实时在线监测的目的。结合信息融合技术,基于人工神经网络的结构损伤识别系统能在噪声环境下,从大量、复杂的监测数据