基于规则和对称分析的眼睛定位方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:weijiang321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学的不断发展,越来越多的人机交互系统开始采用人脸这种新颖的生物特征作为其交互的依据,如人脸识别、人脸确认和人脸表情识别。相比指纹,依靠人脸生物特征的系统由于具有非侵犯性、隐蔽性等特征而更容易被人们接受。   在人脸的所有特征中,眼睛是最重要的器官,眼睛定位的准确与否将影响到后续特征提取的效果。因此,人眼的快速准确定位被学者视为基于人脸生物特征的系统走向实用化的关键和瓶颈所在。然而,人脸的检测和眼睛的定位远不是一件轻而易举的事情,其复杂性在于人脸具有很大的类内可变性:人脸是高度可变的物体,其外观取决于许多的因素(光照、姿势、表情、是否存在遮挡物等)。   本文在阅读了大量国内外文献的基础上,提出了一种已应用在机房智能门禁系统上的眼睛定位算法,该算法能适应复杂背景环境(容易与人脸混淆的背景)、多种光照条件和无约束情况下的人脸(无约束的姿势和表情)。   本文基于规则和对称分析的眼睛定位方法首先从采集的图片中利用AdaBoost算法检测得到若干人脸区域。对得到的人脸图片进行光照补偿、眼镜反光填充、椭圆掩膜标准化后,去除了眼镜反光和边缘饰物的影响。接下来使用多个阈值进行分割和区域生长得到人脸特征候选区域,多阈值避免了由于光照造成的特征丢失。在候选区域中根据倒三角形等约束提取出候选的由眼睛对、嘴巴组成的三角形列表。对称检测作为对眼睛精确定位的一个约束被引入本文,仅对眼睛区域的对称检测极大的提高了人脸朝向检测的准确性。最后,结合对称、平行对等信息对眼睛进行精确定位,并根据定位得到的眼睛坐标对源图片进行旋转、裁剪和缩放,以得到几何归一化的人脸作为后续处理的输入。   实验表明,将多阈值得到的候选框进行融合和对称信息的添加极大地提高了眼睛定位的准确性,也使算法基本上达到了应用系统的要求。
其他文献
计算机动画将时间变量引入到虚拟的静态景物世界,使得我们不仅能够操作三维景物,而且可以建立起逼真的景物运动。计算机动画技术是计算机图形学的重要发展,它是传统静态图形技术
随着2005年Intel发布了基于X86的桌面的双核处理器,多核处理器开始流行。处理器的不断发展,由纯粹的频率提升,逐渐转到多核运算、并行执行的方向上。处理器发展到多核阶段,传统的
在集装箱装箱问题的研究中,最小费用多集装箱装箱问题是这样的一个分支:给定n种货物的集合和m种集装箱,每种集装箱都具有不同的价格并且可用的数量是没有限制的。问题的目标是使
如今越来越多的企业希望通过Internet延伸自己的商业行为。Web服务(Web Services)为企业之间的整合提供了一条有效的途径。在将Web服务真正投入生产之前,企业需要考虑Web服务的
互联网的发展极大地改变着人们的生活。搜索引擎帮助人们在浩瀚的信息海洋中找到需要的信息,发挥着十分重要的作用。随着网络服务的不断丰富,搜索引擎也向着个性化、多元化等方
在企业的信息化过程中,随着企业规模的扩大和计算机技术的发展,不同时期构建的信息系统可能基于各种不同平台,结果造成相互间的数据交流效果很不理想,形成了相互隔离的“信息孤岛