论文部分内容阅读
随着近些年互联网和多媒体技术的飞速发展,以及社交媒体的普及,图像信息的数量急剧增加,如何在海量图像中快速检索出想要的信息成为一个研究热点。传统的基于文本的图像检索已经不能满足日益增长的用户需求,基于内容的图像检索(CBIR)应运而生。基于内容的图像检索技术是将图像的内容用图像特征来描述,而不是通过图像命名或者人工标定图像。典型的基于内容的图像检索系统在建立图像数据库时根据各自图像模型提取图像的一种或几种特征组合存入特征库,同时对特征库建立索引以提高查找效率。然后采用相似度匹配算法计算关键图像特征与特征库中的图像特征相似度,按照相似度从大到小将匹配图像反馈给用户。随着智能手机和平板电脑等触屏设备的普及,人机交互方式发生了很大的改变,触控成为了主流的输入方式,人们可以利用触摸屏绘制出印象中图像的草图形式。由于草图更加符合人们对物体轮廓的感知,因此基于草图的图像检索作为基于内容的图像检索的重要分支在近些年受到了更多关注。本文深入研究了基于图像特征的检索技术,总结了现有基于草图的图像检索算法及国内外研究现状。基于草图的图像检索和基于内容的图像检索一样,主要面临三个问题:图像特征的选取、特征之间的相似性度量以及索引结构。本文研究了各类常用的图像特征在基于草图的图像检索中的表现,并选择了图像梯度方向场作为图像特征。梯度方向场是在求取图像边缘梯度方向的基础上,通过扩散的方法得到一个方向场,这样的场在图像边缘上得到的是边缘的方向信息,在非边缘像素得到的是该像素附近边缘像素的梯度方向信息。在提取方向场之前,为了得到图像主要轮廓信息,降低背景和纹理的影响,我们对图像进行了显著性检测处理,主要目的是得到图像显著性部分,得到和草图最相似的轮廓信息。对图像进行均匀划分为一个个的cell,对每个cell提取直方图作为特征描述子。对图像特征采用词袋(bag of words)模型对图像进行检测,即用kmeans算法将特征直方图聚类,得到描述图像特征的视觉单词,这样每一副图像就可以用若干个视觉单词的组合来描述。得到了每幅图像的视觉单词表述,就可以采取倒排索引结构来快速检索图像。本文对从淘宝网上下载的商品图像数据库进行基于成草图的图像检索实验,并在其它一些主流数据库上进行检索实验,验证了算法有效性。实验证明本文的算法在基于草图的图像检索任务的上查询准确率更高。