论文部分内容阅读
行人的检测和再识别是计算机视觉的重要研究内容,主要是从视频或者图像序列中区分并定位出“感兴趣”区域,并对“感兴趣”区域的行人再次识别判断的过程。在不重叠的摄像机视角下,基于计算机视觉和模式识别的行人检测及再识别受到人们越来越多的关注,主要是由于它有着广泛的应用领域,尤其是在智能视频监控、交通、刑侦等重要领域。尽管行人检测和再识别近年来已经取得了很大的进展,但是在实际应用场景中仍存在一些问题。例如公交车、地铁或者商场等,这些场合下由于受到光照、遮挡、视角、背景混乱以及衣服颜色近似等因素的影响,行人的检测和再识别仍然是计算机视觉领域中极具挑战性的课题。基于图像视频处理的行人检测和再识别算法,如何克服光照剧烈变化以及遮挡等外在因素的影响,高效地检测出公交乘客并且正确地识别出乘客,是本文的主要研究内容,具体工作如下:(1)针对公交乘客的检测,提出一种基于人头肩的增强聚合滤波通道特征乘客检测算法。公交车客流量比较大,且易受光照、遮挡等外在因素影响。本文通过多尺度Retinex预处理,消除光照以及噪声等对图片处理造成的影响;训练学习乘客头肩的模型,避免遮挡而误检;利用聚合滤波通道特征的检测算法,在多个尺度上提取图像的通道特征,对底层特征采用滤波器组进行滤波,结合boosted决策树训练分类,在公共数据集和公交车乘客数据集上的实验,证明了提出算法的有效性;(2)针对公交乘客的再识别,提出一种基于改进的Fisher线性向量编码描述符和交叉视角二次判别分析度量学习组合的再识别算法。对于检测出来的乘客,基于图像像素点的简单7维特征去描述局部特征,利用高斯混合模型对特征数据建模,Fisher线性向量聚合组成通道特征描述符,在HSV颜色空间上求取最终的特征表示描述符;然后将样本的高维特征,通过低维特征子空间和度量矩阵进行降维学习,实现类内样本的特征距离小于类间样本的特征距离。针对公交乘客头肩数据库,基于改进的Fisher线性向量编码描述符和交叉视角二次判别分析度量算法的再识别率达到了87.33%。