论文部分内容阅读
生物特征识别技术是基于人的生理或行为特征进行身份识别的技术。步态识别是一种新兴的生物特征识别技术,它根据人走路的姿势识别人的身份。与指纹、人脸、虹膜等生物特征相比,步态具有远距离、非接触、难伪装、难隐藏的特点,是目前远距离下最有潜力的生物特征。随着安全敏感场合对大范围视觉监控系统的迫切需求,步态识别受到了计算机视觉研究者们的广泛关注。现有的步态识别算法几乎都是基于监督学习的,即仅利用少量的标记样本训练学习器。一般来说,用来训练的标记样本越多系统的识别性能和泛化能力就越强。但是,人工标记样本是耗时耗力的,尤其是步态视频的采集不像指纹、人脸等生物特征的采集那样简单快捷,步态采集过程更加费时费力,而且被采集者一般不喜欢按照既定的要求一遍遍反复行走,这就使步态数据的标记工作变得非常困难。然而,考虑到实际的视频监控系统,我们能很容易获得大量的步态视频,若充分利用这些“廉价的”未标记数据来帮助训练学习器,则不仅避免了未标记数据资源的浪费,还能提高系统的识别性能和泛化能力。半监督学习恰好解决了这一问题,它利用大量的未标记样本辅助少量的标记样本共同构建更好的学习器,而无需人工干预。因此,本文提出了一种基于self-training的半监督步态识别算法,其主要工作如下:提出了基于self-training的半监督步态识别算法,它同时利用大量的未标记步态序列和少量的标记步态序列共同构建更好的分类器。首先,利用少量的标记步态序列进行PCA训练获得特征空间转换矩阵并进一步求得步态序列的特征(即训练集),然后使用该训练集对未标记步态序列进行分类。通常,将每类中置信度最高的未标记序列及其预测的类别添加到训练集中。然后对新的训练集重新进行PCA训练,重复该过程直到达到一定的循环次数或者训练集不再增大。实验结果表明,即使初始时每类只有一个标记步态序列,在大量未标记序列的帮助下,系统依然能自动优化至较好的性能。创建了新的步态数据库。对步态识别而言,每类要有足够多的步态序列才能充分验证半监督步态识别算法的有效性。然而,目前所有的公开步态数据库都不满足这一条件。因此,为了充分验证算法的有效性,我们创建了新的步态数据库。该数据库最大的特点是每个人有多达40个步态序列,这就使实验结果更具说服力。在该数据库上的实验结果表明,采用本文提出的算法既充分利用了大量的未标记序列,大大减小了标记代价,又能经过自训练过程使系统自动优化至令人满意的识别性能。尽管实验结果证明了本文提出算法的有效性,但仍存在诸多局限性,如视角固定、运动背景简单等。因此,未来的工作主要在于提高算法的鲁棒性,如利用多摄像机技术进行人体步态的三维数据恢复,实现算法的视角无关性;开发更加鲁棒的运动检测算法,实现真实环境下的运动分割;融合多种步态特征来提高算法鲁棒性等。