基于图像哈希检索的图像重排方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:kim5618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的飞速发展,图像已经成为多媒体信息的一种重要表现形式,越来越多的实际需求使基于内容的图像检索应运而生。为了适应海量图像库的检索需求并降低“维数灾难”的影响,研究人员利用图像哈希的方法将图像特征映射成二进制哈希码,用哈希码间的汉明距离表示图像间的相似程度。利用图像哈希方法实现图像检索的优势主要有以下两点:首先,计算机能够快速计算哈希码间的汉明距离,因此能够适应海量图像库的检索需求;其次,用哈希码来表示图像库中的图像,能够大大降低数据的存储量。但是图像哈希方法也存在一定的局限性,由于衡量哈希码间相似性的汉明距离是整数,对于海量图像库来说,可能会存在成千上万幅图像和查询图像的汉明距离相等,因此按照何种顺序返回汉明距离相等的图像已经成为急需解决的问题。本文对图像哈希方法和基于哈希检索的图像重排方法进行了研究,主要贡献如下:(1)研究了典型的哈希函数学习方法,包括两种基于随机映射和两种基于PCA映射的哈希方法,并从理论分析和实验验证两个角度对不同哈希方法的优缺点进行分析。(2)改进了基于PCA映射的图像哈希重排方法。首先介绍并实现了基于紧凑哈希码的重排方法(QAIS)和基于PCA映射的重排方法(QsRank),并对它们的优缺点进行分析。QsRank重排方法的理论依据是映射过程保留了欧式空间的ε近邻关系,因此对基于随机映射的哈希方法的重排效果不太理想;而且由于QsRank重排方法不再利用哈希码间的汉明距离对图像进行排序,破坏了哈希检索速度快的优势。本文将哈希检索的高效性和QsRank方法的优势相结合,提出了IQsRank重排方法,实验结果证明了IQsRank重排方法具有更高的检索准确率,而且对不同的哈希方法具有鲁棒性。(3)提出了基于自适应权重的图像哈希重排方法(QAR)。为了解决现有基于哈希检索的图像重排方法中存在的问题,本文针对哈希映射函数的特点,将图像库的语义类别信息与哈希函数在每个维度进行关联,通过为每个语义类训练类权重向量,结合传统哈希检索的结果,为查询图像计算自适应权重,并构造自适应加权汉明距离,将离散的汉明距离连续化,解决汉明距离相等图像的排序问题。实验结果证明,QAR重排方法能够提高多种哈希方法的检索准确率,检索效果优于其他哈希重排方法。感谢国家自然科学基金重大项目(基金号:70890083)对本研究的支持。
其他文献
分形作为非线性科学的重要分支之一,其理论和方法在雷达、声纳、无线通讯、射电天文等诸多领域得到了广泛的应用研究。在前人研究成果的基础上,本文着重对海杂波的分形特性及其
随着无线通信业务的高速发展,频谱资源的严重不足日益成为遏制无线通信事业发展的瓶颈,感知无线电(CR)技术由于能有效提高频谱利用率而备受关注。传统的感知无线电技术需要检测
无线自组网是由一组自带无线收发装置的移动节点组成的无线网络系统。无线MAC协议处在无线自组网的较低层,它决定节点接入信道的方式。由于自组网的无中心、自治自愈、节点移
目前,果蔬生鲜等农副产品在网上逐渐热卖,本课题以水果为例进行研究,主要围绕两个问题展开:一是如何让用户快速在网上商城选择心仪的水果;二是水果如何搭配吃才更健康合理。
距离信息的获取是计算机视觉领域非常热门的研究方向之一,PMD(PotonicMixer Device)相机可以实时高效的获得目标的距离信息,然而存在随机噪声较大,水平分辨率低、缺少表面信息等局
随着人工智能技术的飞速发展,具有高智能性移动机器人的研究受到了国内外研究者的广泛青睐。路径规划是机器人智能控制技术中的一个重要问题,具有智能学习能力的路径规划算法的
学位
基于大词汇量连续语音识别(LVCSR)的语音检索是音频信息检索的重要研究方向。本论文针对该方向的三个重要技术问题进行研究:第一,从多途径来提高语音识别结果的准确性;第二,针
正交频分复用(OFDM)技术由于其高频谱利用率、抗频率选择性衰落等优点,越来越受到重视。但作为一种多载波调制技术,其对同步误差十分敏感。OFDM技术是以正交子载波为基础,定时偏
由于摄像模组在完成各零件的组装后,其镜头与图像传感器间的距离是随机的,并且往往处于离焦状态,从而导致物像不共轭而引起拍照模糊,因而必须调焦。解像力是衡量一个模组成像