论文部分内容阅读
基于内容的图像检索是计算机视觉领域的重要研究方向之一,广泛应用在搜索引擎、室内定位和图像补全等应用中。在现实场景中,两张包含相同物体的图像由于姿态、背景和光照等干扰因素的影响在外观往往差异较大,如何让机器能够在特征空间得到相似的特征表达是问题的本质。主流的基于深度学习的图像检索算法很少说明多监督信息对任务的影响和作用,往往只基于分类信息来训练网络,缺少了度量空间等其他方面的监督信息。其次在网络特征提取的算法中往往只考虑高层次的语义特征,忽略了低层次特征以及位置特征对基于内容图像检索任务的重要性。 本文提出了适用于图像检索任务的卷积网络和特征提取算法。深度卷积网络模型主要涉及多监督信息和跳层连通机制两个方面。网络同时考虑单一样本的类别信息和不同样本在特征空间的相对距离信息,并将两种监督信息网络化,多任务方式联合训练指导参数更新。为了使每一层次的深度特征具有符合监督信息的语义特点,网络使用了跳层连接的机制使高层次语义特征和低层次语义特征在训练的过程中相互流通。 根据基于内容的图像检索任务的实际应用场景对不同级别语义信息的需求,特征提取算法融合了不同层次的特征图。通过可视化分析特征图,得到图像在某一语义层次上可能包含多个具有判别性特征的结论,所以特征提取的算法又考虑了不同位置的语义信息。由此得到的图像特征表达更加适合基于内容的图像检索任务。 为了验证提出的网络结构和特征提取算法的有效性,本文在Paris、Oxford和商品数据集上做了验证实验。实验的结果验证了本文所提出的网络结构的有效性,同时验证了特征提取算法有效性和优越性。