基于HR和Siamese Net的人脸检测与跟踪研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:andytong0123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人与机器人自然交互在现实应用中具有重要的研究价值,而人脸是人机交互过程中最具个性特征的部位,人脸检测和跟踪是人与机器人交互中的关键技术,在实际应用场景中由于光线强弱、遮挡、旋转、尺度变化等因素使人脸的检测和跟踪带来挑战,本研究主要针对非限定条件下人脸检测和跟踪的多种算法进行对比研究并改进,使改进后的算法更适应不同条件的人脸检测和跟踪任务。
  首先,本课题就国内外人脸检测和跟踪算法研究现状进行调研,然后,就目前取得先进水平的基于深度学习的人脸检测算法进行对比实验,混合分辨率(hybrid-resolution,HR)算法着重针对人脸多尺度问题,创建一个图像金字塔分别训练不同检测器,提高了小人脸的检测精确度。由于在深度模型中,数据集对视觉任务的性能有很大的影响,本课题将原来的模型训练数据量加大约16倍,发现我们的新模型用更少的训练轮数下,用于检测后人脸跟踪精度提升约2%。
  由于深度学习的方法在人脸识别、检测等任务中运用较多而且取得了领先水平,而在跟踪领域基于深度学习方法的研究较少,本课题着重对比分析了传统目标跟踪算法和基于深度学习的方法优缺点,提出一种基于深度学习的人脸跟踪算法。由于目前还没有公开标注的用于人脸跟踪任务的大量数据集,本研究中将用于人脸验证的大量有监督数据集Youtube Faces用于人脸跟踪任务模型的训练,同时手工标注了不同背景下的人脸跟踪测试集,实验结果表明使用与视觉任务相关的数据集对跟踪的性能有较大提升。
  此外,原Siamese-Net算法在目标特征提取阶段采用AlexNet卷积层,而该卷积神经网络的卷积核较大,在分类检测任务的研究中已有成果证明VGG16网络相对于AlexNet更有利于视觉任务的性能提升,本研究通过实验对比分析采用VGG16模型的不同卷积层数对人脸跟踪性能的影响,实验结果表明采用VGG16卷积层作为人脸跟踪任务特征提取器能提高人脸跟踪的性能同时采用2层卷积层性能最佳。同时本研究通过多次实验选取了相对较优参数。
  最后,由于原Siamese-Net算法只能进行单人脸跟踪,本课题针对实际应用对多人脸跟踪的需求,结合改进HR算法和改进Siamese-Net算法实现了多人脸自动检测和跟踪系统,在多人脸测试集上取得鲁棒效果。
其他文献
基于密度泛函理论体系下的第一性原理平面波超软赝势法,计算了纯TiO2体系、S、Pt单掺以及S-Pt共掺TiO2四种体系的能带结构、态密度和光学性质.结果表明:只有共掺体系为间接跃迁类型,其他体系均为直接跃迁类型.掺杂后TiO2体系的禁带宽度均减小,其中Pt单掺后的能带间隙最小.由态密度图得知共掺体系减小的原因是由Ti的3d态、O的2p态、S的3p态和Pt的5d态共同作用.吸收图谱中共掺体系的红移比
VB12发酵液过滤是药品制取工艺中重要的操作环节,直接影响制品的收率、质量和生产效率。采用直接过滤的方法不能满足工业生产,在对原有过滤设备(板框式过滤机)不进行改动的情况下,实验采用加入絮凝剂进行预处理,然后利用硅藻土助滤剂进行加压过滤实验,研究影响过滤速率的主要因素,改善滤饼结构,达到固液分离的效果。论文首先通过絮凝剂选择正交实验,以絮凝剂自身的性质、絮凝剂的加入量、水体pH值、搅拌速度和搅拌时
学位
1997年,东京大学的Fujishima等人报道了紫外光诱导下氧化钛表面产生超亲水性能的现象。这一现象在实际应用上的重要性立刻引起了许多研究机构和公司的重视。氧化钛薄膜的光诱导超亲水性能是一个新的研究方向,对其发生的机理以及光诱导超亲水性能与材料结构的关系等尚有待进一步研究。另外,虽然氧化钛薄膜在强紫外光照射下很快能够达到超亲水状态,但在弱紫外光照射下或停止光照后,不能产生超亲水性能。所以,如何使
本文介绍了空调列车DC600V供电系统的组成,论述了使用DC600V供电系统的意义,指出了其所存在的问题,并针对问题进行了分析.首先对空调列车600V供电系统的负载建立了模型.在两种负载模型下,通过计算分析了滤波电感和电容对电源电压波动的影响;通过使用MATLAB解微分方程求电容电压和电流的方法,比较了两级滤波和一级滤波两种形式下,电容对电源电压波动的影响.并用仿真的方法进行了验证.设定各种负载变
学位
与传统正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)系统相比,基于交错正交幅度调制的滤波器组多载波(Offset Quadrature Amplitude Modulation based Filter Bank Multi-Carrier,OQAM/FBMC)系统具有频谱带外泄漏低、支持异步传输和无需添加循环前缀等优势,适用于第五代
微震信号属于典型的非线性、低信噪比信号,包含岩石破裂信号、爆破信号、机械震动和其他施工噪声信号。近年来,微震监测技术作为有效的地压监测手段,被广泛地应用于滑坡监测和煤矿安全高效生产领域。微震信号的检测与识别是微震监测技术的关键,主要分为微震信号预处理、信号特征提取、信号模式识别三大模块。  微震信号预处理常采用短时傅里叶变换、小波变换、S变换等时频变换方法,这些方法可以全面有效地保留信号的时频信息
学位
随着互联网技术的快速发展,网络的覆盖率与使用率呈指数增长趋势,同时网络的复杂性与日俱增,随之而来的网络安全问题也日益突出。如何快速有效地评估网络的安全状况,并准确分析网络安全态势成为目前亟待解决的问题之一。网络安全态势评估技术作为一项综合全面的安全分析技术,已经成为网络安全领域的研究热点。目前的网络安全态势评估技术主要从网络攻击、系统脆弱性和服务信息等方面对网络安全状况进行综合分析,较少考虑用户行
学位
干涉合成孔径雷达测量技术(Interferometry Synthetic Aperture Radar,InSAR)是利用SAR系统的天线,来获取同一目标地区的具有相干性和一定视角差的复SAR图像技术,并利用干涉相位信息来获取目标地区的高程数据模型( Digital Elevation Model,DEM)。本文主要研究InSAR系统数据处理中的相位解缠技术,其主要研究内容和工作如下:  (1)
扑翼无人机属于仿生飞行器,它与生物界鸟类或昆虫有着类似的飞行特征,主要是通过两侧机翼的上下扑动产生飞行的动力。在军事领域,无人机可以对敌方侦查、干扰以及攻击,它的作用正显得愈发重要。相对于一般的飞行器,扑翼无人机有着小型化,易隐蔽躲藏,高机动性与灵活性等优势,因而受到学者的普遍关注,成为了热门的研究方向。本文借鉴国内外相关文献,提出了扑翼无人机动力学建模、姿态控制和多无人机自主协同控制中的任务分配
[db:内容简介]