基于时空稀疏编码的动态人脸识别算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cerlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的飞速发展,以及人们对安防领域的潜在需求,促进了各种计算机视觉算法的诞生。生活中随处可见的摄像头为算法提供了大量的视频数据,奠定了视频处理的发展基础。在身份验证领域,最容易获得的数据是人脸。人脸相比指纹、虹膜等更具有直接性、友好性和可靠性,大量的人脸识别算法应运而生。传统的基于静态图片的人脸识别已经发展到了瓶颈,而视频中包含了更多的时间和空间上的信息,具有更大的研究空间。同时视频中的人脸识别面临了更多的变化性,不同的视频清晰度不一、光照变化范围大、人脸的姿态和表情种类繁杂,且容易遇到遮挡,这都是研究中的潜在挑战。本文探讨了两类常见的视频人脸识别算法,分析了它们的优缺点。在现有的二维稀疏编码和池化特征提取方法的基础上,提出了一种基于序列的三维视频人脸特征提取算法。该算法将待检测的视频人脸序列切分成固定长度的子序列,这些子序列按照时间顺序合并成一个三维的立方像素块。从该立方块中切分出一系列标准大小的小立方块,随机从中抽取部分小立方块,用K-SVD算法制作字典,以该字典为基求得各立方块的稀疏系数作为特征。由于稀疏编码的高维性,该算法采用多个不同层次的池化,在同时保留整体和局部特征的情况下,对子序列的特征做降维。降维后的特征使用线性SVM分类器做分类,得到了不错的正确率。实验表明,在本文建立的数据集上,当用总样本的10%作为训练集时,该算法相比普通的二维稀疏编码方法正确率提高了14.66%。
其他文献
伴随我国股权分置改革的完成,境内A股上市公司第一大股东持股比例呈现逐年下降态势,我国资本市场已经具备上市公司展开大规模收购的能力和条件。“宝万之争”掀起了我国第二轮敌意收购的浪潮,上市公司控制权争夺日益激烈,其核心就在于董事会席位的争夺。本文着眼于公司控制权争夺中最具代表性的制约董事改选条款,从以下几个方面展开法律效力分析:首章分析我国上市公司章程中制约董事改选条款的现状。首先,明晰制约董事改选条
在当前的制造企业之中,数据异构的问题非常普遍,各个部门往往有自己独立的系统为生产、制造服务,而各个系统本身又是独立进行开发的,因此各个系统之间存在很大的异构性,难以进行交互。因此,如何将异构的数据融合起来,形成企业数据的完整全貌,从而对企业的数据进行管理,同时适应数据的动态变化,从而能够对企业的生产提供支持,是当前一个突出的问题。本文旨在利用本体这一技术,通过由多个数据源构建统一的实例本体的方式将
由于高速列车发展迅猛,使得高速列车冷却技术受到广泛关注,而板翅式换热器以换热效率高、结构紧凑、轻巧等优势受到青睐,论文以一种板翅式换热器的波纹通道为对象,用数值方法研究了波纹翅片通道的传热和流动特性,并将波纹翅片通道结果与平直翅片通道进行对比。在雷诺数等于300-2200范围内,还考察了波纹翅片通道几何参数(波纹振幅,波纹波长,翅片高度,翅片宽度)对通道传热和流动的影响。论文主要研究结果如下。在论
随着低功耗集成电路,无线通信技术,智能传感器和微电子技术的快速发展,人们开始更加关心个人的身体健康问题,因此无线体域网(Wireless Body Area Networks,WBANs)技术应运而生。WBANs可以远程实时地监测患者的重要生理参数,并且及时提供相对应的治疗。这些生理数据属于高度隐私的信息,关系到患者的生命健康,并且面临着很多安全威胁。为了确保患者重要生理参数及隐私的安全性,WBA
大数据时代带给我们的不仅是海量的数据,更多的是数据复杂性和维度多样性的增加。在数据科学与统计学习中,设计复杂多维度问题的高效算法成为一个重要研究方向,其中对海量数据的降维处理方法是研究的关键点。稀疏Envelope模型是对高维数据进行参数估计和响应变量选择的有效模型之一。稀疏Envelope模型已经建立良好的统计性质,但对该模型算法理论的研究还不够完善。由于在实际应用中,需要进行交叉验证确定超参的
既有铁路提速改造两年多以来,工务设备养修的作业条件发生根本的变化,大型养路机械、检控设备的应用,彻底改变了传统的线路维修方式。而桥梁设备的检查、养修,因专业性较强,在铁路
东海是西北太平洋主要的边缘海之一,其营养盐来源的多样性是支撑该区域高生产力的主要原因。研究资料表明,黑潮向东海输送的营养盐,特别是磷酸盐,对东海生态系统起到重要作用。但是目前对于年际尺度上,黑潮磷酸盐输送的变化及对东海生态系统影响的基本特征及具体机制研究较少。本文通过一个太平洋区域,分辨率为12.5公里的ROMS-CoSiNE海洋物理-生态耦合模式1997-2016年的积分结果,探究黑潮向东海输送
图像拼接是计算机视觉领域中的一个重要课题,广泛应用于全景视频监控、遥感地图生成、虚拟现实等领域。近年来一系列新的图像拼接算法不断被提出,但是这些算法对大视差图像进行拼接时,容易产生鬼影和局部扭曲等问题。因此研究设计一个针对近物距场景下的视差图像拼接算法是一个具有重要实际意义的技术难题。论文针对宝钢质押钢卷仓库下狭窄巷道中拍摄的大视差图像拼接进行研究,设计实现了一种结合全局配准与局部配准修正的图像拼
辣椒素(Capsaicin)是辣椒果实中体现辛辣味道的有效成分,由于其具有良好的抗氧化、抗菌效果,已经被广泛应用在餐饮、医疗、国防、美容各方面,且相关领域对辣椒素的需求呈现出
实际中收集的数据往往带有空间地理属性.具有空间坐标或相对位置的数据统称为空间数据,这些空间数据之间存在一定的相关性.关于空间数据的统计分析一直以来是统计学和计量经济学的一个研究热点,所以本文考虑空间地理标记下半参数模型的统计推断,具有重要的理论意义和价值.本文重点研究{(Yi,Xi,Zi),i ∈GN}为强混合随机场时空间模型的估计问题,包括模型中参数和非参数两部分的估计.参数分量估计量在张量积B