论文部分内容阅读
自动图像标注是基于内容图像检索中重要而具有挑战性的工作,它可以在一定程度上解决基于内容图像检索中存在的语义鸿沟问题。如果能实现自动图像标注,那么现有的图像检索问题实际上就可以转化成技术已相当成熟的的文本检索问题。因此,自动图像标注的研究是一个有重要意义的课题。 本文围绕基于图理论的自动图像标注展开研究,在分析现有的各种自动图像标注方法不足之处的基础上,提出使用基于图学习的自动图像标注方法。并阐明本文研究的立足点:使用基于图理论的自动图像标注作为传统的图像标注方法的补充,以提高图像标注系统的性能。 底层图像特征提取是自动图像标注系统的基础。本文详细阐述了基于自动图像标注的低层特征提取和图像分割方法,总结和归纳了各种方法的优缺点及适用范围。针对彩色图像存在边缘的模糊性,提出了一种基于模糊熵的图像边缘特征提取算法。该方法首先计算出每个像素在模糊熵特征空间的相异测度,结合邻域内的边缘结构,提取图像中每个像素的结构信息测度和方向信息测度,然后对结构信息测度和方向信息测度实施非极大抑制,确定最终的边缘像素图像。实验结果表明该方法边缘检测能力强,有较好的抗噪性。另外,为了改善JSEG分割算法对彩色图像存在过分割现象,提出了基于边缘信息的JSEG分割改进算法。 图像语义具有模糊性、复杂性、抽象性等特点,仅用低层特征进行描述是不够的,在提取图像语义时需要结合图像相关内容,以便提高图像标注的精确度。为此,本文提出了基于互K近邻图的图像标注方法,该方法用一个互K近邻图融合了图像的低层特征之间、标注词之间以及图像与标注词间的相互关系。利用互K近邻图实现从两个节点间相互的关系来提取语义信息,弥补了基于K近邻图的方法中单方向挖掘节点信息的不足。并引入逆向文档频率(IDF)修正图像节点与其标注词节点之间边的权值,克服了传统方法中高频词引起的偏差,有效的提高了图像标注的性能。在对互K近邻图结构分析的基础上,提出一种快速求解算法,该算法在不明显降低图像标注精度下,实现快速求解。 由于“语义鸿沟”的存在,低层特征相同或相似的图像,其语义有可能完全不同。如何挖掘图像的高层语义与低层特征之间的内在联系是当前图像标注领域研究的难点之一。本文在详细分析现有基于聚类的图像标注方法优缺点的基础上,提出了一种谱聚类图像标注方法。该方法采用以下两种有效途径建立图像的高层语义和低层特征之间的内在联系:首先利用多元统计学中的典型相关性分析(CCA)对图像的语义特征和低层特征进行关联分析,以便建立图像的低层特征与语义特征间的相关性。然后,在CCA空间内,对训练图像先按语义聚类,使得语义相同或相近的图像处于同一类中,再对每个语义类按区域特征聚类,通过这两次聚类能有效地建立图像的低层特征与语义特征间的一致性。实验结果表明所提出的方法明显提高了标注准确度。 前述的标注方法都存在需要大量的已标注图像的缺点,如何通过对少量典型的样本图像进行人工标注作为训练集,实现精确的图像自动标注,已成为当前图像标注领域中研究热点之一。本文在基于图的标签传播的原理与机制的基础上,提出一种利用Voronoi图的构图方法。该方法利用Voronoi图表达了空间目标的影响区域,将图像数据点在特征空间内的分布信息融合到点对间的相似性表示中。利用未标注图像与已标注图像的内在相关性,将半监督学习和多标记学习有效结合起来,为图像进行标注。实验结果表明,提出的标注方法效率高,同时标注结果与传统的标注方法相比得到了明显改善。 传统的标注算法的标注结果都不可避免地存在较大噪声,如标注词之间的不一致性,标注词无意义等现象。因此有必要对各类方法输出的结果进一步优化处理。针对这一问题本文提出一种基于随机点积图的图像标注优化方法。在优化过程中,度量语义相关性是必要步骤,为减少训练图集对度量的影响,本文采用随机点积图的方法对初始标注词构成的拓扑图进行点积随机化得到随机图,并获取对应的转移概率,从而挖掘出原先通过图像集没能得到的语义之间相互关系。结合随机游走算法,实现了对初始语义优化。实验结果表明所提出的方法比其他优化方法在标注准确度上有明显提高。