参数化统计新模型及其应用研究

被引量 : 1次 | 上传用户:xp509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
参数化统计模型是计算机视觉和图像理解中一类非常重要的方法,被广泛应用于图像的特征抽取。然而,传统的参数化统计模型一般仅考虑图像的灰度信息,从而忽略了图像中物体的形状和几何信息。近年来,以主动形状模型和主动表观模型为代表的参数化统计新模型在上述研究领域取得了极大的成功并引起了研究人员的广泛关注。本文以人脸图像理解为例,对上述模型进行了深入探讨,并结合计算机视觉和图像理解研究领域的最新进展对人脸图像理解中的特征点定位和特征抽取问题展开研究。人脸图像理解是指利用计算机技术对数字化图像或视频中的人脸进行解读,从而进一步提取其高层语义信息的技术。作为数字图像分析和理解中的一项重要内容,人脸图像理解得到了计算机视觉、模式识别、人工智能以及认知心理学等领域研究人员的广泛关注。人脸是人体最重要的组成部分之一,传达了重要的交互信息,并在人类的社会活动和交流中起着至关重要的作用。由于人脸图像具有信息容量大、无需直接接触和辨识能力强等优点,人脸图像理解技术被广泛应用于生物特征识别、视频监控、人机交互以及数字多媒体等领域,并逐渐深入到人们日常和社会生活的各个方面。人脸图像理解的研究主要包括人脸检测、人脸特征点定位、人脸对齐、人脸特征抽取以及相应的识别和分类算法等。随着人脸图像理解技术的不断进步,可控环境下的人脸图像理解已经非常成熟。但是,人脸图像的形态结构和纹理变化受姿态、光照和表情等因素影响较为严重,这为人脸图像理解带来了很多困难。要开发出实用环境中鲁棒、快速和高效的人脸图像理解算法,还有很多实际问题有待解决。在人脸图像理解中,统计模型被广泛应用于一个自动化系统的各个阶段,如人脸特征点定位、特征抽取和分类等。然而,传统的统计模型假设人脸的几何信息已经得到很好的对齐,并从对齐好的人脸图像中直接抽取相应的纹理特征,从而忽略了人脸的几何形态变化对特征抽取和人脸图像理解带来的影响。近年来,主动形状模型和主动表观模型在计算机视觉和模式识别研究领域十分活跃。在人脸图像理解中,新的参数化统计模型不仅能够用于抽取有效的人脸纹理特征,而且能够获得精确的人脸形状特征和几何结构信息,从而进一步提取出更加有效的具有语义信息的人脸图像特征。本文工作详细阐述了参数化统计模型和非参数化回归模型在人脸图像理解中的优势和特点,并提出了一系列新算法和新思想,从而为二维人脸图像理解的发展开拓了新的思路。本文的主要研究内容和创新点有:第一,提出了一种在不完备的人脸训练集上对存在大尺度姿态变化的人脸图像建立张量主动表观模型的方法。人脸图像理解中的一个重要难点在于人脸形态和纹理的高度复杂性。受人脸图像中表情、光照、姿态以及遮挡等因素的影响,同一个体的人脸图像往往表现出高度非线性的纹理和几何形态变化。这些变化为人脸特征抽取和进一步的分析带来了极大的困难。近年来,基于张量的子空间分析技术,也被称作多线性子空间分析,被成功地用于解决上述因素变化所带来的人脸图像理解中的困难。然而,建立张量模型往往需要一个数量庞大的、完备的训练集,这为张量分析方法的实际应用带来了诸多问题。本文在基于张量的主动表观模型的基础上,提出了一种能够在不完备的训练集上建立张量主动表观模型的方法。同时,由于人脸的大尺度姿态变化,在建立基于张量的主动表观模型时很难获取一致化的形状和全局纹理信息,为此,本文进一步提出了一种统一化的人脸特征点定位策略。通过在卡内基梅隆大学的Multi-PIE人脸数据库上进行实验发现,本文算法在训练样本缺失比例高达80%的情况下仍然能够保持很好的人脸特征点定位和人脸表观重构精度,从而验证了算法的有效性。第二,提出了一种自适应的基于非参数化级联回归模型的人脸特征点定位算法。尽管参数化的主动形状模型、主动表观模型及其改进算法在可控环境下已经达到了很理想的效果,但是这些算法往往在复杂环境下的实际应用中达不到很好的精度。近年来,基于级联回归模型的人脸特征点定位算法引起了研究人员的极大兴趣。然而,由于实际应用环境中人脸图像的复杂性,使用传统的级联回归模型仍然不能非常精确地对人脸特征点进行定位。为了解决这一问题,本文提出了一种随机级联回归森林算法,该算法通过随机选取部分训练样本建立多个不同的级联回归模型,并将它们得到的人脸特征点定位结果进行融合,从而进一步提高人脸特征点定位算法的鲁棒性。同时,为了解决人脸图像中尺度变化带来的问题,本文还提出一种自适应的人脸形状更新策略和基于稀疏自编码器的局部纹理特征抽取算法。通过在LFPW和COFW人脸数据库上进行测试,验证了本文算法的有效性。最后,为了解决非参数化级联回归模型中训练样本不足的问题,本文提出了使用参数化的三维人脸模型生成虚拟训练样本的方法。利用参数化三维形变模型可以生成大量的带有姿态变化的虚拟人脸样本,从而解决了非参数化级联回归模型训练过程中样本不足的问题。然而,通过三维形变模型生成的虚拟人脸样本往往与真实人脸之间存在较大程度的差异,为此本文进一步提出了一种两阶段的级联回归模型训练策略,从而使得在混合训练集上训练得到的级联回归模型可以很好地适用于真实人脸数据。通过在多个人脸数据库上进行人脸特征点定位实验,验证了新算法的优越性。
其他文献
如果说位于甘肃最西端的敦煌石窟是一个大壁画馆的话,那么,位于甘肃最东端天水市的麦积山石窟则是一座大雕塑馆——被国内外誉为"东方雕塑陈列馆"。
近二十年来,随着国民经济的快速发展和人民生活水平的逐步提高,我国的房地产行业作为新的国民经济的支柱产业得到了非常快速的发展。房价快速上涨,政府关于房地产的政策不断
法律专科学生要克服学习倦怠心理,保持学习的兴趣,除自身应学会学习外,教师还应以学生需要为导向,不断拓宽法律实践教学的渠道,提高学生学习的实效性;学校也应借鉴美国法律教育模式
我国现有垦复利用的野生平榛面积1.33万hm~2,杂交榛子栽培面积5.3万hm~2。随着人工种植时间的增长,生产中逐渐发生各种各样的实际问题,其中杂交榛子雄花序越冬抽干是一个非常
人防电气是一个较复杂的系统工程,就其电气系统的组成来说就十分繁复,各子系统又有着不同的实时性要求。本文从电气设置中电力负荷分级、电源、供电系统、电力线路敷设、电力
电气工程作为人防地下室施工体系的重要组成部分,在实际的设计、施工环节应当采取必要的措施进行管控,确保施工质量和效率,满足现阶段的使用诉求。文章着眼于实际,从多个角度
目的探讨分析多元化护理对干部病房老年糖尿病合并高血压患者焦虑情绪及治疗依从性的影响。方法选取2015年1月~2018年1月来我院接受治疗的60例患有糖尿病合并高血压的老干部,
科技体制改革作为创新驱动发展战略的“双轮驱动”之一,是国家创新体系中的重要支撑.自《国家创新驱动发展战略纲要》发布以来,各省市纷纷出台相关政策来进一步推进科技体制
我国法学专业学生的就业正处在一个寒冰期,而法学专科的学生就更为严峻,除外部环境的因素之外,法学专科学生的培养模式的缺失是一个重要的因素,因此,创新法学专科学生的培养模式是