论文部分内容阅读
作为计算机视觉领域的一项基础性研究工作,视觉场景表达的主要目标是通过综合利用视觉心理学、场景空间布局和上下文内容,以及图像处理技术等挖掘场景中潜在的结构模式,刻画视觉数据之间的内部联系,最终形成对场景良好和简明的抽象表示。目前己广泛应用到智能交通、自动导航、环境监测、医疗诊断、遥感分析和智能购物等工业生产、军事安全和生活实际领域中,具有重要的科研和应用价值。研究表明:视觉数据的结构化描述对于场景的有效表达发挥着至关重要的作用。但是由于自然场景的多样性、复杂性和可变性,目前建立在图结构模型之上的视觉数据关系模式挖掘的研究成果在准确率、效率和鲁棒性等方面仍然面临较大挑战。因此,本文首先围绕图模型中路径优化和距离度量两个角度展开对场景数据之间关系描述的研究,然后着眼于结构保护图像滤波和视觉注意力建模这两个热点应用进行算法设计和实验验证。主要的研究工作如下:
(1)图结构中基于路径优化的视觉数据关系表达方法研究。针对图结构表达中路径生成方法通常面临的视觉相似区域内描述不一致和噪声敏感问题,本文提出了一种基于格式塔分组准则的最平滑路径和平滑短路径优化方法。为实现场景内容的有效表达,文中首先引入人类视觉感知的格式塔分组准则来构造最平滑路径。但是受自然场景区域分布的任意性和噪声影响,空间位置相近、特征相似并且相互连通的图像单元之间的最平滑路径可能出现节点冗余问题,因此文中通过进一步构建平滑短路径方法来有效感知视觉场景内容。实验结果表明:复杂场景条件下,最平滑路径和平滑短路径优化算法在学习数据中潜藏的结构信息和描述场景内容方面的可靠性较强。
(2)图结构中基于路径距离度量分析的视觉数据关系表达方法研究。针对场景表达中距离估计方法通常面临由数据结构非线性、光照变化或边缘不清晰等因素造成的视觉数据之间关系度量偏差问题,本文提出了一种基于路径瓶颈分析的图结构距离度量方法。该方法在综合考虑任意路径顶点之间上下文语义内容和拓扑结构信息的前提下,通过引入基于随机游走模型的路径瓶颈检测和分析方法形成场景中视觉单元之间的关系描述。实验结果表明:路径瓶颈检测距离方法不仅能够在最小化视觉场景类内差异的同时最大化视觉场景类间差异,还能够有效保留部分描述同一场景类内数据之间的关键信息差异。
(3)自然场景条件下的结构保护图像滤波算法研究。针对图像滤波中场景结构和高对比度纹理细节在梯度大小方面的相似性造成的边缘模糊问题,本文提出了一种基于结构尺度自动感知的结构保护图像滤波算法。该方法首先引入能够高度聚集语义一致性视觉单元的聚类距离变换方法,然后通过综合利用邻居视觉单元的决策信息和信任机制设计将聚类距离变换和双边滤波器融合起来的协同滤波模型。实验结果表明:协同边缘保护图像滤波模型在结构保护和纹理、噪声细节平滑方面的鲁棒性较强。
(4)自然场景条件下的视觉注意力建模方法研究。针对显著区域检测算法受场景目标尺度任意性和分布不确定性、光照不均匀性和背景杂乱性等条件影响产生的显著目标非一致高亮现象,本文提出了一种基于场景结构化表达的显著区域检测算法。该方法首先利用格式塔分组准则建立关于场景全局拓扑结构的路径描述,然后通过路径拉普拉斯分析方法估计结构连通度,最后将背景连通先验和外观对比度线索融合起来定义显著度。实验结果表明:本文提出的显著目标检测模型有效提高了均匀一致高亮显著区域和抑制非显著区域方面的整体性能。
(1)图结构中基于路径优化的视觉数据关系表达方法研究。针对图结构表达中路径生成方法通常面临的视觉相似区域内描述不一致和噪声敏感问题,本文提出了一种基于格式塔分组准则的最平滑路径和平滑短路径优化方法。为实现场景内容的有效表达,文中首先引入人类视觉感知的格式塔分组准则来构造最平滑路径。但是受自然场景区域分布的任意性和噪声影响,空间位置相近、特征相似并且相互连通的图像单元之间的最平滑路径可能出现节点冗余问题,因此文中通过进一步构建平滑短路径方法来有效感知视觉场景内容。实验结果表明:复杂场景条件下,最平滑路径和平滑短路径优化算法在学习数据中潜藏的结构信息和描述场景内容方面的可靠性较强。
(2)图结构中基于路径距离度量分析的视觉数据关系表达方法研究。针对场景表达中距离估计方法通常面临由数据结构非线性、光照变化或边缘不清晰等因素造成的视觉数据之间关系度量偏差问题,本文提出了一种基于路径瓶颈分析的图结构距离度量方法。该方法在综合考虑任意路径顶点之间上下文语义内容和拓扑结构信息的前提下,通过引入基于随机游走模型的路径瓶颈检测和分析方法形成场景中视觉单元之间的关系描述。实验结果表明:路径瓶颈检测距离方法不仅能够在最小化视觉场景类内差异的同时最大化视觉场景类间差异,还能够有效保留部分描述同一场景类内数据之间的关键信息差异。
(3)自然场景条件下的结构保护图像滤波算法研究。针对图像滤波中场景结构和高对比度纹理细节在梯度大小方面的相似性造成的边缘模糊问题,本文提出了一种基于结构尺度自动感知的结构保护图像滤波算法。该方法首先引入能够高度聚集语义一致性视觉单元的聚类距离变换方法,然后通过综合利用邻居视觉单元的决策信息和信任机制设计将聚类距离变换和双边滤波器融合起来的协同滤波模型。实验结果表明:协同边缘保护图像滤波模型在结构保护和纹理、噪声细节平滑方面的鲁棒性较强。
(4)自然场景条件下的视觉注意力建模方法研究。针对显著区域检测算法受场景目标尺度任意性和分布不确定性、光照不均匀性和背景杂乱性等条件影响产生的显著目标非一致高亮现象,本文提出了一种基于场景结构化表达的显著区域检测算法。该方法首先利用格式塔分组准则建立关于场景全局拓扑结构的路径描述,然后通过路径拉普拉斯分析方法估计结构连通度,最后将背景连通先验和外观对比度线索融合起来定义显著度。实验结果表明:本文提出的显著目标检测模型有效提高了均匀一致高亮显著区域和抑制非显著区域方面的整体性能。