论文部分内容阅读
图像语义内容的自动抽取是多媒体和计算机视觉等领域的一个研究热点。其中,如何抽取给定图像中感兴趣区域的边界又是决定相关图像语义抽取算法成败的关键所在。边界不同于传统的边缘,它由目标在图像平面上的轮廓所描述,是确定目标与周围环境的分界线,表示像素的所属权从一个对象到另一个对象的改变。而边缘只是表明了图像中灰度、纹理、亮度等发生跳变的特性。可以说,边界是更高语义层次的边缘。传统的边缘检测或者边界提取大多是以单幅图像为处理对象的,而本文却以立体图对为输入,重点研究如何从立体图对中提取目标边界的问题。为此,本文以有颜色差异的立体图对为研究对象,对相关的颜色校正、立体匹配和边界提取等问题进行了深入的探讨,给出了一个从立体图对出发确定目标边界的系统化解决方案。本文的主要工作和创新点如下:(1)针对实际应用中如何选择图像分割算法的问题,提出了一种图像分割算法性能的主观评价方法。首先让参与者对图像分割结果进行主观评价,然后对打分结果进行统计分析,从不同角度比较各算法的性能。为使最终的评价结果更加公正可信,评价过程中考虑了各算法的参数选取对图像分割结果的影响。具体言之,首先让参与评价的每个算法各选用10组代表性参数进行图像分割,然后对分割结果进行评价以比较各自算法的性能。(2)针对立体图对间可能存在的颜色不一致问题,提出了一种基于图像分割和特征点匹配的颜色校正算法。本算法采取分区域补偿的策略,较好地解决了同一图像的不同区域间颜色特性不一致的问题,克服了“一刀切”式的整体补偿方法的缺点,可以在颜色特性不一致的立体图对间较好地完成颜色补偿任务。同时,本算法直接对立体图对进行补偿,不需要采用标准颜色板等复杂的校正手段,这使得本算法不仅操作简便,应用范围也更广。(3)针对最小最大风险判决准则的不足之处,提出了一种基于分段线性化的通用分类器设计方法。理论计算和实验结果表明,依据本方法设计的分类器的性能接近于贝叶斯分类器。本文将上述基于分段线性化的分类器设计方法用于边界提取,取得了令人满意的结果。(4)建立了一个以算法评价为目的的立体图对图像分割数据库,为今后开展图像分割和边界提取相关研究提供了一个实验和比较平台。和现有的图像分割数据库不同,所建立的数据库是基于立体图对的,既包含了手工分割的结果,又有标准的深度信息。(5)将深度信息和其它底层信息融合起来,提出了一种基于分类判决的边界提取算法。与传统的边界提取算法不同,本算法利用立体图对提供的视差信息完成目标边界的提取任务,这为边界提取算法的发展提供了一个新的思路。