论文部分内容阅读
在过去的十多年里,视频对象的检测与提取技术已受到了计算机视觉领域的广泛关注。在视频编码中,基于内容和利用人眼视觉特性的第2代编码技术已经提出,提取视频对象可以很大地提高压缩效率,并为存储和传输提供了便利。在MPEG-4标准和正在制定的MPEG-7标准中提出了基于对象的检索和浏览技术。在互联网领域的WEB技术中,我们需要提取视频对象,以对静止或动态场景进行查询和交互。另外在模式识别、计算机视觉、视频检索等领域也得到了广泛的应用。MPEG-4作为第二代的视频编码标准,首次提出了基于目标/对象的编码。但是MPEG-4并没有给出视频对象的具体分割方法,只是对视频的编解码过程进行了定义。视频对象分割方法无论是在视频压缩还是在对象编辑的应用上,都占有着举足轻重的作用。因此对视频对象分割方法的研究具有重大的应用价值和理论意义。在对已有视频分割算法进行详细分析的基础上,基于帧内的分割(空域分割),本文提出一种基于边缘检测和分水岭分割相结合的图像分割算法。该方法首先利用边缘检测算子对图像进行边缘检测,通过边缘点的限制,避免区域的过分割,同时通过改进的分水岭分割补充漏检的边缘,使轮廓更加完整,从而得到较好的分割效果。基于帧间的分割(时域分割),本文分析了运动对象检测和提取的基本方法和理论,利用三帧差分与背景差分相结合的方法来进行自适应的运动对象提取,提高了算法的效率。实验证明,该算法能准确、快速地检测和分割提取出运动对象并有很强的鲁棒性,有着广泛的适用性,为视频监控对象的压缩和查询操作提供了坚实的理论基础,具有较好的实用价值。