基于标记点的人脸检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xilotola
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测拥有悠久的研究历史,是计算机视觉中的经典问题之一。现在有许多实际应用如人脸识别等将人脸检测作为系统处理的第一步。虽然经典的Viola-Jones人脸检测算法可以很好地解决限制条件下的人脸检测问题,但是它对实际应用中需要处理的自然人脸图像往往无能为力。为了满足实际应用的需求,研究人员开始关注非限制条件下的人脸检测问题,并且已经取得了丰硕的成果。这些成果可以大致归为两大类,基于级联结构的算法族和基于可变形部件模型的算法族。这些算法将人脸检测推向了一个新的高度。近年来,卷积神经网络方法在图像分类和目标检测等问题上得到了最好的结果。这给解决非限制条件下的人脸检测问题提供了有益的启示。基于卷积神经网络的人脸检测方法也取得了巨大成功。值得指出的是这些方法往往模型复杂,难于训练,并且稳定性不高。针对这些问题,本文提出了一种新的简单的人脸检测算法,并且在FDDB人脸检测数据集上与目前最好的方法有着相近的表现。本文的主要研究内容可归结为:(1)提出了一个新的简单的人脸检测算法。算法模型是一个单一的卷积神经网络,以端到端的方式进行训练。检测算法是基于人脸标记点的,通过使用分类方法来检测输入图像中的人脸标记点,结合K-均值算法和预定义盒子来生成人脸候选区域。(2)采用了两种方法来提高人脸位置和大小的回归精度:在进行标记点检测前使用反卷积对卷积特征进行增采样来提高卷积特征的分辨率;采用多任务损失函数恰当地处理了分类误差和回归误差,并且分开处理不同尺度不同比例情形下的回归误差。
其他文献
高速、可靠和及时的数据传输是无线通信系统的关键需求。应用差错控制技术、链路自适应技术和抗衰落技术来解决通信传输过程中存在的多径传播、多普勒频移、衰落等问题,能保
6-氰基-(3R,5R)-二羟基己酸叔丁酯是降胆固醇特效药他汀类药物的重要手性中间体,具有重要的应用价值。由于酶法不对称催化具有反应条件温和、转化率高及立体选择性好等优点,
在核电厂中,蒸汽发生器是正常运行工况下的重要部件之一。蒸汽发生器中的传热管与一、二回路的流体直接接触,除进行热交换外还能防止放射性物质进入二回路损伤核电站中的其他
移动WiMAX网络支持VoIP(Voice Over IP)等时延敏感的多媒体通信业务,如果切换过程不能很好的进行,则可能造成MS(Mobile Station)与CN(Communicati on Node)通信的中断,从而严
QK18-1油田位于渤海西部海域,油田从2005年开始采用注水方式进行开采。目前注水开发暴露出注入压力偏大,注水困难及酸化防膨频繁,储层结垢严重等系列问题,采出程度17.3%,注采
土木结构的设计使用年限通常高达几十年,桥梁结构甚至超过百年,但在结构自身缺陷及外部荷载作用下,有些结构往往达不到设计使用年限即出现破坏或倒塌,因而有必要对结构在使用
甲烷(CH4)是一种具有高辐射增温的温室气体,其高于CO2 25倍的辐射增温效应使其对全球气候变暖的影响备受关注。稻田是CH4最主要的人为排放源之一,估计每年向大气中排放量达50
与传统的视频监控系统相比,智能视频监控系统具有“自动”、“先知”、“快速响应”等诸多优点,且通常由视频采集前端和系统后台组成,涉及到视频的采集与编码、视频流的网络
地震动是一种复杂的多维空间运动,其对空间结构的作用和影响也是多维的。但在传统的研究中,人们通常将地震动分解到三条坐标轴,作为三个相互独立的标量来研究其特性。该做法
MOCVD(金属有机物气相化学沉积)是被应用得最广泛的一种制备半导体材料、光电器件以及电子器件的技术。为达到快速、均匀地加热衬底的目的,MOCVD设备中均设置有加热系统,其作