论文部分内容阅读
随着计算机科学的不断发展,越来越多的人机交互系统开始采用人脸这种新颖的生物特征作为其交互的依据,如人脸识别、人脸确认和人脸表情识别。相比指纹,依靠人脸生物特征的系统由于具有非侵犯性、隐蔽性等特征而更容易被人们接受。
在人脸的所有特征中,眼睛是最重要的器官,眼睛定位的准确与否将影响到后续特征提取的效果。因此,人眼的快速准确定位被学者视为基于人脸生物特征的系统走向实用化的关键和瓶颈所在。然而,人脸的检测和眼睛的定位远不是一件轻而易举的事情,其复杂性在于人脸具有很大的类内可变性:人脸是高度可变的物体,其外观取决于许多的因素(光照、姿势、表情、是否存在遮挡物等)。
本文在阅读了大量国内外文献的基础上,提出了一种已应用在机房智能门禁系统上的眼睛定位算法,该算法能适应复杂背景环境(容易与人脸混淆的背景)、多种光照条件和无约束情况下的人脸(无约束的姿势和表情)。
本文基于规则和对称分析的眼睛定位方法首先从采集的图片中利用AdaBoost算法检测得到若干人脸区域。对得到的人脸图片进行光照补偿、眼镜反光填充、椭圆掩膜标准化后,去除了眼镜反光和边缘饰物的影响。接下来使用多个阈值进行分割和区域生长得到人脸特征候选区域,多阈值避免了由于光照造成的特征丢失。在候选区域中根据倒三角形等约束提取出候选的由眼睛对、嘴巴组成的三角形列表。对称检测作为对眼睛精确定位的一个约束被引入本文,仅对眼睛区域的对称检测极大的提高了人脸朝向检测的准确性。最后,结合对称、平行对等信息对眼睛进行精确定位,并根据定位得到的眼睛坐标对源图片进行旋转、裁剪和缩放,以得到几何归一化的人脸作为后续处理的输入。
实验表明,将多阈值得到的候选框进行融合和对称信息的添加极大地提高了眼睛定位的准确性,也使算法基本上达到了应用系统的要求。