论文部分内容阅读
图像分割就是把图像划分成不同的区域,其中每个区域均具有特定的含义。图像与视频分割是计算机视觉和图像处理领域的一个研究热点,也是一个颇具挑战性的研究课题,并且几乎是所有基于图像分析的人工智能技术的基础,为众多的高层应用如检测、识别及跟踪提供了最重要的依据,其分割质量的好坏将直接影响后续图像技术任务的有效性。然而由于缺乏对人类视觉系统的深层认识,图像分割同时也成为了计算机视觉领域的一个经典难题。在近几年的研究中,基于变分模型的图像分割方法得到了广泛关注和研究,在实际应用中也取得了良好的效果。这种方法将图像本身的特征信息及目标的位置和形状大小等先验知识有机的结合在一个能量函数中,通过最小化这一能量函数有效地分割图像目标。而图割(Graph Cuts)优化方法作为一种优秀的优化工具由于其优良特性也受到了国内外学者的广泛关注,在图像分割领域中成为了一个新的研究热点。本文的研究就是针对图像分割领域中的一些问题,对基于变分模型的图像分割方法,以及图割优化算法进行了较为深入的总结、分析和研究,提出了一种改进的新的变分模型,并基于此模型对图割模型框架的诸多环节进行了优化设计,研究了如何高性能的分割图像和视频目标。具体的,本文的主要创新成果包括以下几个部分。首先,针对经典的基于边缘和区域的变分模型存在的局部最小化和无法处理异质目标或多目标等主要问题,对经典的CV模型进行了改进,提出了一种多分段常数的变分模型能量泛函,同时融合了经典的基于边缘的测地线主动轮廓(Geodesic Active Contours, GAC)模型,提出了一种新的多分段常数(Multiple Piecewise Constant, MPC-GAC)变分模型,并使用图割优化算法对能量函数进行最小化求解。通过人工标记进行初始化,接着进行迭代计算,构建了一种高性能的交互式图像目标分割方法。然后,为了提出一种能够广泛运用的具有普遍意义的自动图像分割方法,本文将前而提出的MPC-GAC模型扩展到多类的形式即融入GAC模型的多类多分段常数(Multiphase Multiple Piecewise Constant, MMPC-GAC)模型,为了解决这一多类问题的最小化求解,采用了多层图的图割优化算法来对这一能量函数进行近似的最小化求解,并通过误差分析展示了多层图图割优化算法相对于α-expansion方法的优越性。为了解决多类问题在计算求解中庞大的计算量问题,本文引入了四色原理对分割区域进行重标记,从而将分割的类别数总是控制在四类以下,得到了一种实用的高性能的多类自动图像分割方法。最后,针对传统的背景建模方法在进行视频目标分割时因为没有利用相邻像素问的空间域信息,致使在运动目标分割结果上总是存在噪声分布、运动目标提取分散、目标区域捕获不完整、突发性高斯白噪声无法处理等问题,提出了将视频中的运动目标分割问题纳入到一个马尔科夫随机场(Markov Random Field, MRF)能量函数模型中,并在这个能量函数模型中深度融合了视频的时问域信息(使用混合高斯模型获取)和空间域信息,同时提出了一种3D图割优化算法,在对能量函数进行最小化的同时进一步加强了时空域信息融合,从而得到了一种高性能的视频运动目标分割方法。本文通过大量的自然真实图像和视频的分割实验验证了这几种基于改进的变分模型能量函数和图割优化的图像和视频分割方法的有效性和实用性。