非控环境下的人脸特征提取与分类算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:L175913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的来临,由于在网络购物、网上银行、电子支付、门禁系统、监控体系、刑事侦查等领域的应用前景广阔,人脸识别受到了越来越多研究者的关注。目前已有的人脸识别方法主要集中于解决可控或半可控环境下的人脸识别问题,针对非控环境下的人脸识别算法较少。非控环境下的人脸识别受光照、姿态、遮挡、表情、年龄、种族等干扰因素的综合影响,传统算法在进行特征提取时引入的干扰信息较多,因而给后续的分类工作也带来较大的困难。本文针对目前经典算法应用于非控环境下人脸识别时产生的识别率低、实时性较差等问题进行研究,从特征提取算法、分类器设计两个方面开展研究,主要的工作内容包括以下几个方面:(1)受生物视觉注意机制的启发,研究主动形状模型(Active Shape Model,ASM)算法,对生物视觉ROI区域(即眉毛、眼睛、鼻子、嘴巴等区域)进行关键点标记,在此基础上研究并采用梯度方向直方图(Histograms of Oriented Gradients,HOG)算法进行人脸特征提取,提出了基于关键点的HOG人脸特征提取算法(Histograms of Oriented Gradients based on key-points,k-HOG)。实验结果证明,本文提出的k-HOG算法相比于经典的全局特征提取算法不仅大大降低了特征维度,而且减少了额头、脸颊等非特征区域冗余信息的干扰,识别率得到提高。(2)经典HOG算法中用梯度算子计算像素点的梯度幅值和梯度方向,它仅描述了水平和垂直两个方向的灰度变化,包含的像素点信息较少,因此本文提出了基于关键点的多尺度多梯度HOG特征提取算法(Multi-Scale Multi-Gradient Histograms of Oriented Gradient based on keypoints,k-MSMG-HOG)。首先设计3*3、5*5两种尺度下四组梯度模板,利用这些模板分别计算各个像素点的梯度变化,统计得到两种尺度下的梯度方向直方图并进行融合,得到最终特征向量。实验结果表明,本文提出的k-MSMG-HOG算法,更全面精细地提取了关键点周围的人脸特征信息,算法的识别率有显著提高。(3)一对多高斯过程分类器(One Against All Gaussian Process Classifier,OAA-GPC)在训练每个二分类器时都需要将所有的训练样本作为输入,因此其对大规模样本进行分类时所耗费的时间代价巨大。本文提出了基于一对一方法的高斯过程多分类器(One Against One Gaussian Process Classifier,OAO-GPC),以及在其基础上改进的基于有向无环图方法的高斯过程多分类器(Directed Acyclic Graph Gaussian Process Classifier,DAG-GPC),这两种分类器在训练二分类器时仅需将所其对应的两类训练样本作为输入,改善了一对多方法的不足,在不降低识别率的基础上大大减少了算法的运行时间。在Oil、Segment、USPS三个数据集上的实验结果均表明,OAO-GPC和DAG-GPC两种分类器的运行时间远远低于OAA-GPC,且识别率与OAA-GPC近似相等;在LFW和ORL数据库上的结果表明,OAO-GPC和DAG-GPC的识别率优于常用的KNN和SVM分类器。由此证明OAO-GPC和DAG-GPC两种分类器可迅速、有效地解决样本的多分类问题。
其他文献
文章在对南宁市城乡一体化联合图书馆建设做基础调查的基础上,对建设过程中出现的主要问题进行了归纳并阐述了相关解决措施.
基于模拟信号的监控系统逐渐淡出了人们的视线,数字视频信号的传输随着Internet的发展触及世界的各个角落,让视频监控真正的实现了“远程”。ARM、DSP、FPGA等SOC技术的成熟,
在MIMO-OFDM系统,比如两发一收的空时格码一正交频分复用(Space-Time trellis code-Orthogonal Frequency Division Multiplexing,STBC-OFDM)系统,空频块码—正交频分复用(Space
乳腺癌是危害妇女健康的最常见的疾病,钼靶X线摄影是目前临床上乳腺疾病检测的主要手段,但是,乳腺肿块大多被埋没在复杂的,高密度的腺体背景中难以检出和识别。因此,利用计算
大数据将当前互联网技术带入了“Web 3.0”时代,它是继“云平台计算”技术之后的又一次革命性技术变革,它丰富了人们获取信息的方式途径,也进一步扩大了信息的传播量.在大数
说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。凭借其独特的经济性、准确性和方便性等优势,
通信因具备容量高、传输安全性高、无需申请频谱以及部署成本低等优点,目前已经获得了快速的发展。然而,由于大气中温度的不均匀性和气压的波动特性,当光信号通过大气湍流信
通用串行总线(USB)是一种具有即插即用、高扩展性、高速稳定等优点的通信接口标准。目前基于PC机的USB应用已趋于成熟,但一些便携式USB设备要求脱离PC机实现数据通信。因此将
期刊
随着数字视频技术在通信和广播领域的广泛应用,使多媒体信息在网络中的处理与传输技术成为研究的热点。2003年3月ITU-T/ISO发布的H.264/AVC标准被称为是新一代的视频编码标准