论文部分内容阅读
随着互联网和多媒体技术的飞速发展,图像已经成为多媒体信息的一种重要表现形式,越来越多的实际需求使基于内容的图像检索应运而生。为了适应海量图像库的检索需求并降低“维数灾难”的影响,研究人员利用图像哈希的方法将图像特征映射成二进制哈希码,用哈希码间的汉明距离表示图像间的相似程度。利用图像哈希方法实现图像检索的优势主要有以下两点:首先,计算机能够快速计算哈希码间的汉明距离,因此能够适应海量图像库的检索需求;其次,用哈希码来表示图像库中的图像,能够大大降低数据的存储量。但是图像哈希方法也存在一定的局限性,由于衡量哈希码间相似性的汉明距离是整数,对于海量图像库来说,可能会存在成千上万幅图像和查询图像的汉明距离相等,因此按照何种顺序返回汉明距离相等的图像已经成为急需解决的问题。本文对图像哈希方法和基于哈希检索的图像重排方法进行了研究,主要贡献如下:(1)研究了典型的哈希函数学习方法,包括两种基于随机映射和两种基于PCA映射的哈希方法,并从理论分析和实验验证两个角度对不同哈希方法的优缺点进行分析。(2)改进了基于PCA映射的图像哈希重排方法。首先介绍并实现了基于紧凑哈希码的重排方法(QAIS)和基于PCA映射的重排方法(QsRank),并对它们的优缺点进行分析。QsRank重排方法的理论依据是映射过程保留了欧式空间的ε近邻关系,因此对基于随机映射的哈希方法的重排效果不太理想;而且由于QsRank重排方法不再利用哈希码间的汉明距离对图像进行排序,破坏了哈希检索速度快的优势。本文将哈希检索的高效性和QsRank方法的优势相结合,提出了IQsRank重排方法,实验结果证明了IQsRank重排方法具有更高的检索准确率,而且对不同的哈希方法具有鲁棒性。(3)提出了基于自适应权重的图像哈希重排方法(QAR)。为了解决现有基于哈希检索的图像重排方法中存在的问题,本文针对哈希映射函数的特点,将图像库的语义类别信息与哈希函数在每个维度进行关联,通过为每个语义类训练类权重向量,结合传统哈希检索的结果,为查询图像计算自适应权重,并构造自适应加权汉明距离,将离散的汉明距离连续化,解决汉明距离相等图像的排序问题。实验结果证明,QAR重排方法能够提高多种哈希方法的检索准确率,检索效果优于其他哈希重排方法。感谢国家自然科学基金重大项目(基金号:70890083)对本研究的支持。