论文部分内容阅读
随着互联网带宽的提高以及计算机信息处理能力的不断提升,多媒体信息本身所包含的海量的数据,使人们能够通过计算机处理多媒体中所包含的有用的信息。对视频信息的处理更是近年来的研究热点。视频本身包含着大量的有用信息,其中人体运动的视觉分析在计算机领域变得尤为突出。近年来,人体运动的视觉分析逐渐成为计算机视觉领域备受关注的前沿方向,其相关的应用领域有虚拟现实、视觉监控、感知接口等。人体运动的视觉分析是近年来计算机视觉领域最为活跃的研究主题之一,其主要是针对包含运动人体的图像序列进行分析处理,通常涉及以下三个部分。第一部分是运动人体的检测,本文指将运动人体区域从图像当中的静态背景区域分离出来。第二部分是运动人体的跟踪,其中包括基于模型的跟踪和基于区域以及基于特征点的跟踪。第三部分是运动人体的行为与理解。其中前两部分属于视觉分析的低级处理,而最后一部分是视觉分析的高级处理。本文主要实现了对视频序列中运动人体的检测、运动人体特征点的提取以及三维重建。按其实现过程分为三步。第一步是运动人体分割。首先进行运动人体检测,利用帧差法实现自适应背景模型的初始化创建及背景更新。针对光照的造成的阴影区域对运动人体检测的影响,本文将RGB彩色空间信息转变成HSV(hue色度,saturation饱和度,value亮度)彩色空间模型的色度和饱和度信息,以此实现对运动人体的精确检测。第二步是运动人体特征点检测。本文采用的核心技术是利用APAR区域提取算法实现运动人体特征点的检测与标定。首先利用APAR区域实现运动人体各个身体部位的标定与识别,然后再利用每个APAR(反向平行线)区域中线的两个端点实现特征点的检测与跟踪。第三步采用Pin-hole原理实现运动人体的二维特征点到摄像机标定的三维空间的映射,以最终实现运动人体特征点的三维重构。