论文部分内容阅读
随着数码产品的普及和互联网技术的发展,图像数据不断涌入互联网,呈现数据规模大、特征维度高、语义关系复杂等特点。哈希算法因其检索速度快、储存成本低等优点成为了基于内容的图像检索领域的热点问题,它将图像映射成紧凑的二值码即哈希码,并保持原始图像的相似性关系,利用紧凑的哈希码进行快速的异或运算对图像进行检索,加快了检索速度,减少了存储消耗。近年来,深度学习被广泛地应用于哈希算法中。相对于传统哈希算法,深度哈希算法的性能有了较大提升,但是目前依然存在一些问题需要解决:(1)主流深度哈希算法利用图像标签构建一个相似矩阵,并利用该相似矩阵监督图像哈希学习,直接利用相似矩阵的方式面临着两个挑战:a.单标签数据的不平衡性:单标签数据的相似对数目远小于不相似对的数目,导致相似矩阵十分稀疏,神经网络难以学习和收敛;b.多标签数据语义挖掘不完全:多个标签导致数据的相似性有了更复杂的演化,相似矩阵仅被简化为相似与不相似的离散关系,导致丰富的语义关系难以准确刻化。(2)深度学习需要大量标注数据进行驱动,需探究一些方式来减轻算法对现有标注数据的依赖,利用其他已标注的相似数据来帮助模型学习,降低人力消耗。针对以上两个问题,本文提出了对应的两个深度哈希算法,内容如下:(1)提出了基于联合语义嵌入的深度哈希算法。该算法构建了两个神经网络:标签网络和图像网络。标签网络旨在挖掘标签的语义特征信息和学习准确的哈希码,并将其学习好的语义特征和哈希码嵌入到两个网络共同的语义空间和汉明空间,在两个层面监督图像网络进行语义特征学习和哈希学习。使用标签网络学到的哈希码来直接监督图像进行哈希学习,代替原始相似性矩阵的直接约束,避免了单标签数据集的不平衡问题;标签网络从多标签中挖掘了丰富的语义特征,构建了更加精确的相似性关系,克服了多标签数据集语义挖掘不完全的问题。(2)提出了基于对抗学习的深度迁移哈希算法。该算法引入了迁移学习中的对抗学习,利用已标注的源域数据集来帮助未标注的目标域数据集进行哈希学习。该算法构建了一个端到端的神经网络,包含了:域特征提取器、域分类器和哈希编码器。其中对域分类器引入域分类损失,期望来自两个域的特征更易区分;域特征提取器引入域混淆损失,期望来自两个域的特征数据难以区分。最终使得域特征提取器从不同域提取的特征分布一致,从而不同域的数据相互协作学习,减少了算法对图像标注的依赖。