论文部分内容阅读
图像与视频是信息的主要传播方式之一,近年来针对图像视频重组整合的问题研究已经成为了数字图像处理技术中的热点方向。针对USB视频中的单人聊天视频,即人物的正面上半身视频,本文主要对基于人眼检测的自动交互算法、单张图像前景提取算法和视频前景提取算法进行了研究,提出了一种基于人眼检测的视频前景自动提取算法。首先,自动检测人眼对象,完成前景与背景的自动交互,获取确定前景和确定背景的区域位置;其次,利用确定前景和确定背景自动提取视频中第一帧图像的前景与背景;最后,利用第一帧图像的前景和背景,自动扩展到后续视频帧的前景提取过程。主要研究成果如下:1.基于人眼检测的自动交互:本文提出了一种改进的Real-Adaboost算法,结合EOH(边缘方向直方图)特征和Haar特征取代传统的单一特征,使得算法训练时,可用较少的训练样本获到较高的检测率,同时大大减少了样本训练时间。然后基于人眼检测结果,结合人体两眼之间的距离与头部和身体等部位的比例关系等先验信息,确定人体上半身和非人体上半身的某些区域,即确定前景和确定背景区域,自动地完成交互式步骤,取代传统的手工交互式获取确定前景和确定背景的方法。2.单张图像前景提取算法:在确定前景与确定背景的基础上,本文采用基于KDE(核密度估计)概率的二元分割方法,提出了一种改进的基于测地线距离的前景提取算法。该方法首先结合KDE概率密度,将确定前景和确定背景扩展至整幅图像,并对图像进行二元分割,然后构造三分图,最后利用测地线距离对图像进行进一步处理,取代传统的在三分图后继续利用KDE概率进行前景提取的方法,可更为快速准确地提取图像前景。3.视频前景提取算法:在获得第一帧图像前景和背景的基础上,根据视频前后帧之间的空间和时间连续一致性原则,结合KDE概率函数,提出了利用积分图计算概率的方法。计算当前帧每个像素属于前一帧图像前景的概率,构造其三分图,并采用测地线距离对三分图的未知区域做进一步细化处理,同时可利用视频图像中人体前景属于一个连通域等先验知识对当前帧的前景进行去噪,去模糊等图形图像算子处理,最终可得到视频每帧的前景图像。最后对本文的工作进行总结,说明本文研究的不足之处,同时指出了下一步研究中所需要开展的工作。