基于颜色和可变形模板的人眼定位与状态检测研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:hetongzhixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人眼检测是人脸检测和人脸识别的一个中间步骤,是自动人脸识别系统中必不可少的一部分。近年来,随着人脸识别在各个领域的广泛应用,人眼检测已经成为计算机视觉领域的研究热点,很多的应用软件都需要鲁棒的提取眼睛的状态特征。目前很多的研究者已经为自动的检测眼睛状态作出了很大的成就:基于方法的可变形模板已经被广泛的应用于检测虹膜,眼角以及眼睑,但是该方法具有较高的计算复杂性,难以预测的模板的收缩和旋转等缺点;根据虹膜特征检测眼睛状态的方法,检测结果不稳定,且鲁棒性较差。另外,以上方法都是基于正面脸部图像的研究,对于发生偏转的图像,检测结果将会失败。  在前人研究的基础上,本文做了三方面的工作:一是,对可变形模板方法做了改进,克服了原来模板难以预测的收缩和旋转等不足,同时动态选择阈值和眼角区域的运用使得眼睑的边缘检测和用来控制眼睑模板的两个势能项有了更好的性能。二是,提出了一个自动、实时的检测眼睛状态的方法。该方法将彩色信息和边缘信息结合起来(彩色的饱和度用来判断眼睛的睁闭状态,眼睛图像的边缘地图用于检测虹膜)使得检测结果更加精确。三是,在前面两点的基础之上,集成了一个实时鲁棒的眼睛检测和跟踪系统,该系统主要针对在同一平面内面部图像的旋转问题,做了创新。大胆的尝试了使用数学上不变矩Zernike矩来提取眼睛的旋转不变性特征,将其作为SVM分类器的输入,用来检测发生偏转了的脸部图像,得到了精确的检测结果。  为了验证方法的性能,做了大量的实验,选取了上万幅的图像,实验结果证明,本文的方法是鲁棒的。
其他文献
信息技术的飞速发展使得旅游信息呈爆炸式增长,面对海量的旅游资源,游客想要从中找到满足其需求的旅游信息变得日益困难;另一方面,游客的旅游观念也日益成熟和个性化,现有的旅游信
网络视频已经成为继门户、搜索引擎之后又一热门互联网应用。视频网站不仅需要提供优质的视频内容和良好的用户体验,还必须具备分析运营数据的能力,从而及时做出决策。互联网
随着互联网的快速发展,Web资源已成为企业获得竞争情报的重要来源。但是,从Web资源中获取的文本情报信息量往往比较大,来源广泛,不利于阅读分析,同时也存在着很多重复的内容,
随着微电子技术、计算技术以及无线通信技术的进步,低功耗多功能的传感器得到了快速的发展,而且无线传感器网络已经被广泛地应用。无线传感器网络以数据为中心,提供数据采集
结构光三维视觉技术中经常先要对编码结构光图像中的纹线进行检测,获取结构光纹线的边缘位置、边缘方向、角点等信息。由于物体形状、表面深度等三维信息的作用,还有图像拍摄
数据仓库中存储着海量数据,支持的查询形式复杂,如何达到查询的高效性是数据仓库面临的难题之一,物化视图是解决这一难题的重要手段。但是,物化视图带来了存储空间和视图维护
作为人类情感最直观的表达方式,人脸表情及其相关的研究工作已经在医疗、商业以及家庭生活等领域产生了深远的影响。本文对人脸表情系统中的特征提取和分类识别进行了分析研
旅行商问题是组合优化中最典型的NP完全问题之一,具有重要的理论与实际应用价值。由于NP完全问题无法用多项式算法解决,许多智能优化算法得以发展并用于求解TSP问题,例如模拟
图像压缩是数据压缩的一个重要分支,它的相关研究已经取得了重要的进展。为了实现对图像更有效的压缩,人们提出了许多理论和方法,分形图像编码就是其中之一。分形图像编码以
DNA序列拼接是基因组测序的核心问题之一。从1977年Sanger测序技术发明开始,到2005年第二代测序技术问世这段时间,DNA测序主要采用Sanger测序技术。Sanger测序技术测得的DNA片