论文部分内容阅读
随着互联网技术的飞速发展,多媒体数据呈现出了指数增长态势。如何在规模庞大的数据中挖掘出有用的关键信息,是迫切需要解决的问题。图像检索聚焦于图像数据,旨在从图像数据库中搜索出符合用户意图的图像集合。基于内容的图像检索,允许用户直接将图像作为查询手段,因而图像的视觉特性及语义属性成为了重要的研究内容。在检索的流程中,图像表征和相似性度量方法对检索精度的影响至关重要。基于图像表征,欧氏距离度量能够快速判定图像之间的相关程度,是被普遍采用的度量方法之一。然而,大量研究表明,由于缺乏对特征空间中图像分布以及图像近邻关系的有效利用,欧氏距离度量的准确性直接受限于图像特征的区分力。本文聚焦于基于内容的图像检索问题,展开对图模型的研究,提出基于相似性传播的多级特征增强、基于图神经网络的图像重表征两种算法,将图像的近邻属性融入图像表征,从而提升图像表征的区分力,进而显著改善欧氏距离度量的准确性。首先,本文提出了基于相似性传播的多级特征增强方法。基于传播的相似性度量方法主要应用于在线查询的重排序过程中,限制了检索系统的时间效率和空间效率。基于上述考虑,本文提出将图传播过程从在线阶段迁移到离线阶段,利用这种传播机制挖掘数据库图像的流形结构与图像之间潜在的关联性,并利用近邻图像的特征进行线性加权融合,对每张图像的特征进行增强。进一步地,为了充分利用近邻的层级特性,在多个近邻尺度上实施特征增强。藉由此方式,将流形结构嵌入到图像特征之中,使潜在的相关图像在特征空间更加接近,起到隐式的聚类效果。针对大数据集,采用多粒度聚类方案,有效地减少了量化误差。该方法还能推广到多特征场景下,利用参考特征来辅助主特征的增强过程,扬长避短。其次,本文提出了基于图神经网络的图像重表征方法。图神经网络在半监督分类等任务上卓有成效,但是在图像检索任务中鲜有应用。本文利用图神经网络学习一种聚合方式,用于聚合近邻节点的特征,并结合加权机制,为每张图像进行重新表征。结合残差连接方式,可以通过级联的方法构建不同深度的网络,进而对不同层级的近邻属性加以利用。将排序目标与分类目标结合,共同优化,只需要少量的样本,就可以训练出性能优异的重表征模型。在新的表征下,同类图像相似度进一步提高,而不同类别的图像差异性被扩大。此外,本文提出“自近邻”的方法为查询图像进行重表征,便捷高效。本文提出的重表征方法能够灵活地适应不同大小、不同形式的连接图。该方法能够与其他重排序方法无缝衔接,进一步提升检索准确性。在公开的检索数据集上的实验表明:本文提出的方法具有较好的检索准确率、较低的检索复杂度以及较好的可扩展性。