论文部分内容阅读
传统的基于内容图像搜索系统中,给定一幅图片,系统返回一组和查询图片视觉外观相似的图片。不同于这类系统,本文的目标是搜索或者检测查询图片中出现的特定物体,并以此提取图片的语义信息从而达到理解图片的目的。为了解决这个问题,我们首先设计并实现了两种物体搜索系统,他们分别是基于BoW模型的物体搜索系统和基于关键点匹配的物体搜索系统。其次,我们提出了一个对多种商标进行同时检测的商标检测系统。最后,我们基于多商标检测系统,设计并实现了一种先检测后搜索的框架,一定程度上解决了小物体搜索这一难题。本文的主要贡献可以总结为如下三点:首先,我们设计并实现了一个基于BoW模型的物体搜索系统并对码书训练、相似度度量和索引结构进行了改进。在公共测试库上的实验结果表明,相比现有的方法,该方法得到的结果有稳定的提升;其次,我们设计并实现了一种基于关键点匹配的物体搜索系统。该系统通过近似最近邻搜索和选择性核函数,从根本上解决了BoW模型中量化误差较大以及对称度量的缺陷。在公共数据库上的最终试验结果表明,在保持和基于BoW模型的搜索系统同一数量级的时空复杂度情况下,该系统较大幅度地提升了搜索精度。最后,我们提出了一种多商标检测系统。该系统中引入了基于树结构的形状描述子来同时描述图像局部的视觉和位置信息。同时,通过对训练好的模型建立索引,该系统可以同时检测多个商标。在多个公共测试集上的实验结果表明,该方法在保持非常高的检测精度的同时,其漏检率低于现有的商标检测方法。