论文部分内容阅读
图像是多媒体信息中应用最广泛的载体,其检索也是信息检索领域中最受关注的热点之一。基于内容的图像检索通过提取图像视觉特征实现检索,但图像视觉特征与人对图像的理解存在差异。因此,本文利用视觉注意模型和显著特征来减小语义差异改善检索性能。 本文主要对图像的显著特征、预分类及区域检索三个方面进行了研究,并在此基础上提出了基于显著特征的图像检索模型。该模型首先将图像分成两类,显著类和背景类,然后根据图像类型采用不同的检索方法。本文工作主要包括: 1、研究现有的视觉注意模型,提出一种新的显著特征提取算法。首先提取图像区域级、像素级、全局及频率域等不同层次的显著图,然后对这五种显著图进行网格分块。最后,融合每种显著图下的特征向量得到图像的综合显著特征。 2、图像预分类研究。显著图中显著区域分布呈现不同特点,其中显著性图像的分布集中且具有语义特点,而场景或背景类图像的分布则较为分散。预分类时,本文将综合显著特征作为随机森林分类器的输入,与单一显著特征相比,其分类错误率有了大幅度降低。由于场景GIST特征对背景类图像有较强的描述能力,实验中将综合显著特征与GIST特征进行融合,其分类性能得到进一步提高。 3、基于区域的图像检索。对于预分类得到的显著性图像,本文提取显著区域,并将前景背景视为两个区域,使用区域差异化方法描述图像内容后再进行检索。在进行显著区域提取时,将改进的彩色图像梯度图作为分水岭算法的输入,用显著度指导种子区域选择。实验表明,该方法提取的显著区域更符合用户的感知,与传统方法相比,其平均召回率提升了2.7个百分点。 本文使用C++语言、Matlab和SQLServer数据库构建了以上述算法为基础的图像检索系统,为了进行比较本文也实现了其它一些算法。