论文部分内容阅读
本文研究了图像分割的相关算法,包括基于肤色的图像分割、椭圆轮廓的快速检测、基于Snake的轮廓检测、基于PCA的边缘检测、基于像素几何特性的连续边缘抽取等,并将它们用于人脸自动检测。
彩色图像处理中,颜色一直是区分不同目标的重要依据。颜色空间有多种,基于RGB的三基色空间是用三个通道表示每个像素的颜色,三个通道是相互独立的,像素的亮度信息与色彩信息混合在一起,颜色之间是无序的,无论怎样规定顺序,从视觉上来看,相邻颜色之间也难以做到保持相关性。正因为如此,为了分离色彩和亮度,使得颜色能够相对有序,提出了很多颜色空间,如HSV、HSB、HSL、YCrCb、Lab、XYZ、YUV等。这些颜色空间都是企图将色彩从三维降到二维,将亮度与色彩分离,虽然每种空间在一定范围内能够适用,但都还不能够具有通用性和彻底性。从三维变换到二维本身就是有损变换,不可能做到一一对应,所以这样的空间与RGB空间相比,颜色集小了;每种空间也不可能完全分离颜色和亮度,用二维数据表示颜色,颜色之间也还不是线性有序的。本文在颜色排序方面做了一些分析和尝试。
肤色处理是彩色图像处理中的一个分支,处理与人体相关的图像,使用肤色分割可以提高图像分割的速度。尽管任何一个肤色模型都不能包含所有状况下的肤色,但每一种模型在实用中都有着自身的优势。本文在分析了颜色排序和各种肤色模型的基础上,提出了一个融合色彩和亮度的三维球形肤色模型,并用实验证明了模型的实用性。
人的脸、各种球、车轮等自然界的很多物体都是圆形的,图像处理中,椭圆的识别和检测也是常用的算法。本文提出了一个在彩色图像中快速抽取椭圆的算法,并在人脸检测中检验了它。确定一个椭圆需要5个参数,圆心横坐标、纵坐标、主轴、辅轴、旋转角度,很多算法都是用Hough变换找这5个参数,计算量大,而且不能检测非完整椭圆。本文提出的椭圆检测算法从椭圆的几何特性出发,对分割出的区域抽取轮廓,计算区域的质心作为区域中心点,根据主辅轴的正交特性确定轴长和旋转角度,得到理想椭圆,最后将轮廓与理想椭圆拟合,确定区域是否是椭圆。实验中将本文算法与Hough变换算法作了比较,本文算法要快于传统的FEHT(Fast Ellipse Hough Transform)算法。
基于二阶统计特性的主分量分析(PCA)方法,通常是用于人脸识别中,本文利用它的数据聚合方向和分列处理的几何方向性,将它用于边缘检测。用PCA抽取矩阵特征值时,是在数据集中寻找一组正交的投影轴,投影数据最密集的那条轴就是第一主分量,也是数据聚合的主方向;矩阵中的数据是按行列存放的,为了聚合数据,需选择能将尽量多的相似数据聚在一起的投影方向,这就说明PCA总是从数据集中找相似数据子集,每个子集内的类内离散度要最小,即数据要相似,反映在图像上,就是灰度值要一致,当用部分主分量近似表示数据集时,图像中的大块灰度平滑区域就能被抽取出来,与较大特征值对应的特征向量就是由灰度平滑区域的数据构成的。基于PCA的边缘检测方法检测到的边缘没有Canny算法细致,没有Sobel算法准确,但与人的视觉感受比较接近。沿着这一思路深入研究,基于高阶统计特性的独立成分分析(ICA)、线性鉴别分析(LDA)等方法也应该同样可以用于图像处理的低层操作中。
Snake算法是动态轮廓抽取中智能化程度较高的算法。它将蛇的生理特征引入到图像处理中,用图像的不同特征代替蛇爬行时的前进力和身体张力,在一定条件下能够成功地获得凹凸轮廓。由于该算法会受到起始点和收敛性的影响,很多人提出了改进算法。本文提出利用图像的相邻像素点颜色特征改进图像力,使得Snake算法可以直接在彩色图像上实现。
奇异值分解(SVD)用于人脸识别和人脸检测的算法很多,是因为SVD对图像有着几个很有用的性质,但是SVD的计算量是很大的,本文通过深入分析,提出了对SV的一种估计算法。SV与图像的亮度之间存在着联系,利用这种联系,可以估计SV,减小计算量,加快图像处理的速度,降低运算复杂度。