8-bit CNN人脸检测跟踪在线学习系统设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:woshixiaogao132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测技术目前应用广泛,是当前人脸识别与验证等应用的基础。基于卷积神经网络的人脸检测技术在准确率上已经远超传统方法,但是庞大的计算量和参数量是卷积神经网络的一大缺点,也成为其在实际场景中部署的重要阻碍。另外,目前绝大多数卷积神经网络都是采用离线训练的方式,在部署之后其参数就不会再改变,所以难以针对实际部署的场景进行自适应调整。因此设计一种能够在检测精度和计算量之间取得良好的平衡,并且能够针对部署场景进行在线学习的轻量级人脸检测算法,对于实现终端设备人脸检测算法的部署具有十分重要的意义。本文首先介绍了目标检测和人脸检测算法、网络量化算法、目标跟踪算法和在线学习相关算法的发展过程和典型方法。在人脸检测算法方面,分析了当前主流的轻量级卷积算子,并且为了保证算法的精度,对网络的特征金字塔进行改进,在不增加计算量的前提下,采用像素混洗的方式对特征图进行放大和通道缩减,保证了网络提取到的特征能够被充分利用,设计了能够在精度和计算量之间取得良好平衡的人脸检测网络。在网络量化方面,为了减少算法的复杂性,在训练时对参数范围进行了一定的压缩。在人脸跟踪方面,本文在分析当前多目标跟踪算法原理的基础上,结合多目标检测算法设计了人脸跟踪器。此外,本文提出了一种在线学习策略:将网络的预测分支进行复制,一个分支的参数固定,另一个分支的参数进行在线更新,使网络同时具有较强的泛化能力和对部署场景的自适应能力。最后,本文将量化的在线学习人脸检测与跟踪算法在嵌入式平台上进行了验证。本文设计的人脸检测算法,在WIDER FACE人脸检测数据集的三个子测试集上分别获得92.3%、90.7%和78.2%的检测精度,并且其模型大小仅为4.6 MB。经过量化为8bits之后其精度分别为91.6%、90.3%和77.1%,精度下降均在1%左右,量化后模型大小仅1.3MB。本文所提出的在线学习方法,WIDER FACE经过单次遍历训练之后可获得约0.1%的精度提升。本文算法在树莓派4B开发板上能够达到12FPS的运行速度。本文研究对轻量级人脸检测算法在终端设备上的应用,特别是对网络在进行部署之后的在线学习具有一定的参考意义。
其他文献
随着国民经济和现代科学信息技术的进步发展,移动式机器人越来越广泛地应用于我们的日常生活,甚至国家战略领域,对人类社会具有重要意义。能够在未知环境下精确定位决定了移动机器人能否成功地进行自主导航和完成各种任务。因此,本文以双目惯性视觉传感器在复杂环境下移动机器人自主定位为研究背景,研究了基于双目惯性视觉里程计的室内定位技术,为在复杂环境中进行工作的机器人提供精确的定位信息。本文的主要研究内容和创新点
舰船等水声目标辐射噪声的线谱是现代声纳设备探测和捕捉的重要对象。受到阵列有效孔径与目标方位的关联性、海洋环境中的低频强干扰和阵形畸变等因素的影响,阵列接收到的多个目标线谱特征常发生互扰,严重影响目标检测和识别的性能。因此对水声目标辐射噪声线谱进行辨识是非常重要的课题。本文主要探讨了基于时空起伏特性的线谱辨识方法,通过仿真数据和海试数据的处理验证了线谱辨识方法的有效性。主要研究内容如下:1.通过对舰
云计算与边缘计算的快速发展,助力算力从云端下沉到边缘,形成泛在的计算资源。为推动计算和网络资源的深度融合,研究人员提出了算力网络的概念。在算力网络的架构中,算力服务层是联系算力资源和用户需求的桥梁,可基于微服务架构实现,灵活地为用户需求提供特定的服务实例。因此,研究面向算力网络的微服务调度策略,对算力网络的进一步落地实施具有重要的意义。现有工作中,Kubernetes服务编排系统和以Istio为代
为了缓解城市的交通拥堵问题,近年来国家大力提倡公交优先政策。城市公交作为市民最基本的出行方式,其服务质量直接影响市民的出行选择和城市交通的整体发展水平。为了提高城市公交的吸引力和竞争力,有必要对公交服务质量和优化方案进行深入研究。本文提出了运用乘客出行链为工具,以城市公交线网作为主体,来深入研究运营服务系统中存在的现状与不足之处。运用问卷调查的方式获得了城市公共服务质量评价指标的原始数据,将问卷调
互联网与信息技术的飞速发展,使人们的生活变得越来越丰富多彩,与此同时,日益复杂的网络环境也给网络管理和网络安全带来了挑战。网络异常是指由于网络故障、网络拥塞或网络攻击造成的网络无法正常工作的现象,有效地检测网络异常现象对于维持网络正常运行并且保障网络安全至关重要。目前存在的大部分异常检测与流量分类算法都是针对单条链路或局部网络进行分析,缺乏对全局网络信息的把握,这会造成检测和分类精度不高。所以本文
钢筋混凝土拱桥结构美观,受力明确,施工简便,使得这种桥型在我国早期得到了广泛的应用,但是由于运营期间诸多因素的影响,结构已然存在不同程度的病害和缺陷,急需维修加固和改造。在维修加固前,均需对其进行合理的检算和分析,从而评估桥梁承载能力,最终提出有效的维修加固措施。本文在总结目前国内外关于承载能力评估和加固研究成果的基础上,评估既有钢筋混凝土拱桥的现状、探讨加固方法适用性、分析对比加固前后的承载能力
精度高、适应性强的轨迹跟踪控制策略是电动汽车实现智能化、实用化的基本条件之一。本文结合前轮转向与轮毂电机差速转向协同控制的优势,进行轮毂电机驱动电动汽车轨迹跟踪控制策略的研究。建立车辆动力学模型与轮胎模型,结合PID控制与Ackermann-Jeantand转向模型构建电子差速模型。基于车辆运动学建立模型预测轨迹跟踪控制驾驶员模型。借助Car Sim与Simulink联合仿真模型将上述电子差速模型
得益于硬件性能与数据采集、存储技术的迅猛发展,深度学习已经成为当下最为流行的机器学习技术。然而,采集并标注数据费时费力,由此,充分地利用少量标注样本训练一个泛化性较佳的深度学习模型成为了一个十分有价值的研究课题。单样本人脸识别作为该研究课题中的一个代表性问题,使用待识别人物的单张人脸样本进行网络训练,使深度学习人脸识别算法对数据量的需求降至最低,具有重要的现实意义与广阔的应用前景。本文基于深度迁移
高速铁路是我国“新基建”政策的发展方向之一。目前依据振动压实测量值评判路基压实质量的智能压实技术被认为是我国高铁智能建造的重要组成部分,受到研究者的广泛关注。然而现有技术未考虑含水率对路基压实质量的影响,造成在实践中智能压实技术测试不准确,精度不高。因此在智能压实过程中引入含水率实时测试对于提高测试精度,保障路基压实质量具有重要价值。电阻率法实时测试土体含水率被认为是一个可能途径。本文以高铁路基智
图分类作为一类面向具有不规则拓扑结构数据的复杂分类问题,广泛存在于社交网络分析、机器视觉、脑科学以及生物化学药剂研发等交叉学科研究领域。由于其数据所蕴涵的非线性结构难以在欧式空间(Euclidean Space)中进行直接而有效地表示与计算,导致该问题无法简单采用传统机器学习方法进行直接求解,通常需要先将数据在其他可计算空间中进行嵌入表示处理。近来,图卷积神经网络等表示学习算法的提出为图结构数据的