Gabor小波变换在人脸识别中的应用研究

被引量 : 0次 | 上传用户:hellokitty420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受公共安全、金融安全、人机交互等领域大量潜在的需求所驱动,计算机人脸识别技术已经成为计算机视觉领域的研究热点。特别是近十年来,各种各样的人脸识别算法相继被提出并取得了成功的应用。然而,自动人脸识别仍然是计算机视觉领域的一个难点所在。其主要原因在于,人脸图像在获取过程中会受到诸如姿态、表情、光照、拍摄时间等因素的影响。因此,一个实际的人脸识别算法应该对这些干扰具有较强的鲁棒性。Gabor小波核与哺乳动物视觉皮层细胞的感受野类似,具有优良的空间局部性、空间频率及方向选择性等,因而可以捕获图像在不同频率、不同方向下的边缘及局部显著特征。因此,研究者将其广泛用于人脸识别,以提取出鲁棒的人脸特征。然而,过高维数的Gabor特征需要大的存储空间且使得识别过程非常耗时。为了降低Gabor特征的维数,传统的基于Gabor小波变换的人脸识别方法是将人脸图像与多尺度、多方向的Gabor小波函数卷积之后,对Gabor幅值特征进行下采样或特征选择,然后将它们级联起来形成人脸的特征表示。然而,下采样会丢失许多有用的判别信息且得到的特征维数仍然很高。另外,从如此高维的特征中选择出最有用的鉴别信息有着极大的时间开销。同时,这两种技术理论上需要匹配图像对应像素点之间的对准,而这通常很难做到,因此会造成误配准问题。针对Gabor特征的维数过高问题及识别过程中的误配准问题,本文从多个方面探索了人脸的Gabor纹理特征,并将二维流形子空间分析应用于Gabor幅值图像。归纳起来,本文主要创新性成果包括:①提出了基于Gabor幅值的统计纹理特征的零空间线性判别分析(NLDA)算法。在纹理检索及纹理分割领域,Gabor幅值的统计纹理特征(如均值、标准差等)取得了广泛而成功的应用。它既能充分利用原始的Gabor幅值信息,又能极大地降低特征的维数。因此本文首次将其用于人脸识别。为了获取鲁棒的局部纹理特征,本文首先将人脸的Gabor幅值图像划分成许多等大、互不重叠的子图像,然后在其内计算幅值的统计性(均值、标准差)作为局部纹理特征。最后,将它们级联起来作为人脸的特征表示。识别之前,本文采用NLDA对纹理特征向量进一步降维,以增强其鉴别力。实验结果显示,本文所提算法能有效地降低Gabor特征的维数,且识别性能优于下采样之后的Gabor幅值特征的NLDA分析。②从人类视觉的纹理感知特性出发,利用Gabor幅值与相位的分布特性作为纹理特征,提出了两种新的纹理表征方法用于人脸识别:基于Gabor幅值的纹理表征(GMTR)与基于Gabor相位的纹理表征(GPTR)。本文首先采用Kullback-Leibler距离验证了伽玛分布与广义高斯分布分别能较精确地拟合Gabor幅值与相位的分布。于是,GMTR由伽玛分布拟合Gabor幅值的分布来刻画,而GPTR由广义高斯分布拟合Gabor相位的分布来刻画,拟合的参数作为纹理特征。GMTR与GPTR能以紧凑的表征方式极大地降低Gabor特征的维数。另外,为了检验Gabor幅值与相位信息对识别的互补性,本文将GMTR与GPTR在特征级融合,得到融合的纹理特征向量。实验结果显示,GMTR与GPTR的识别性能明显优于下采样的Gabor幅值特征,而且它们的融合能取得较单一纹理特征更好的识别效果。③利用Gabor实部与虚部的分布特性作为纹理特征,提出了两种新的纹理表征方法用于人脸识别:基于Gabor实部的纹理表征(GRTR)与基于Gabor虚部的纹理表征(GITR)。由于人脸图像的Gabor滤波系数,即实部与虚部的分布可以由广义高斯分布较精确地拟合,因此GRTR与GITR采用广义高斯分布分别拟合Gabor实部与虚部的分布,并将拟合得到的参数作为纹理特征。同样,GRTR与GITR能以紧凑的表征方式极大地降低Gabor特征的维数。最后,为了检验Gabor实部与虚部对人脸识别的互补性,本文将GRTR与GITR在决策级融合,提出了一种融合算法。实验结果表明,GRTR与GITR的识别性能同样优于下采样的Gabor幅值特征,而且它们在决策级的融合也取得了更好的识别效果。④提出了子模式的二维局部保持映射算法。二维局部保持映射算法(2DLPP)是基于全局人脸的流形学习算法,当外界环境变化较大时,其识别性能显著下降。针对此问题,本文首次将子模式技术与2DLPP结合,提出了基于子模式的2DLPP算法(Sp-2DLPP)。Sp-2DLPP算法将人脸图像划分成多个等大、互不重叠的子图像,并在其上进行2DLPP分析。在识别阶段,每个子图像的2DLPP特征被用来构建一个独立的分类器,其分类结果由sum规则融合起来。因此,Sp-2DLPP算法既利用了图像的局部信息,又保留了局部区域的空间结构信息。实验结果证实了Sp-2DLPP算法能显著提高2DLPP的鲁棒性。⑤提出了Gabor幅值特征的Sp-2DLPP算法。如前所述,传统的基于Gabor小波变换的人脸识别方法是将下采样之后的Gabor幅值特征级联起来,以形成人脸的特征表示,从而造成了高维的特征空间。而本文提出的Sp-2DLPP算法是直接基于子图像矩阵进行分析的,无需将2D矩阵转换成1D向量,因而可以解决Gabor特征维数过高的问题。于是,本文将Sp-2DLPP算法应用于人脸的Gabor幅值图像,提出了基于Gabor幅值特征的Sp-2DLPP算法。实验结果表明,基于Gabor幅值特征的Sp-2DLPP算法的识别性能明显优于基于图像灰度特征的Sp-2DLPP算法,再次验证了Gabor滤波特征较图像的原始灰度特征具有更强的判别能力。
其他文献
词典对第二语言学习者的自主学习有着重要的作用。我国的对外汉语学习词典在留学生中的低拥有率需引起重视。针对目前对外汉语学习词典编纂方面存在的问题,提出几点思考:提高
蒲城县农业生产光热资源丰富,降水量偏少且分布不均,农业生产潜力巨大,是陕西省的农业大县,该县种植业结构的调整在该县农业生产潜力的发掘和陕西省农业生产中具有重要作用。
根据三角高程测量原理与误差传播定律及分配原则,推导了大气折光系数反演模型。利用高低棱镜同时对向观测方法,对一个测段上具有偶数条边的闭合网进行观测,消除了仪镜高测量
本文试图从广义修辞学的角度研究《马桥词典》的修辞世界,分析《马桥词典》文本的话语建构方式。论文抓住《马桥词典》创作上的最大特点:它是用词典形式写小说,从话语建构层
"布洛陀"与"姆六甲"是壮族神话中塑造的文化祖先。二者的关系在不同神话文本中曾发生多次变化,形成不同类型。这些变化既体现出构建始祖文化体系的内在诉求,也受到人类进程中婚姻
操作风险日益成为商业银行风险防范的重点,但由于其厚尾性特征以及建模所需数据极其匮乏,至今仍没有普遍接受的计量方法。本文将非寿险精算的信度理论应用于操作风险测量,推
自联合国教科文组织通过《保护非物质文化遗产公约》后,对于非物质文化遗产的保护和传承成为热点问题,不同的观点被提出,并相互争论。通过对成都中国非物质文化遗产国家公园
广西作为中国相对落后的西部省区,近年来,经济社会得到了快速的发展,尤其是2003年10月在中国政府温家宝总理倡议下,东盟十国同意将广西首府南宁作为中国——东盟博览会每年年
该系统是基于STM32单片机的简易数字式万用表,可以用来测量电阻,电容,电感的大小。该万用表具有价格低,测量范围大,精度高的特点,量程可以自动切换,可以自动校零,使用方便。
本论文是一篇基于网络化视频监控技术研究,主要分五个部分对这一相关技术进行了阐述。IP网络化视频监控是未来社会视频技术的潮流,它融合了计算机互联网中多项技术领域、包括