论文部分内容阅读
随着互联网的发展,网络上的图片信息成爆炸式增长,人们对于图像检索的需求越来越大,其中,对于商标图像的检索,无论在科研还是商业上都有极大的研究与应用价值。 本文围绕基于内容的商标图像检索展开了一系列的研究,提出了一种大规模商标图像数据集下的高效检索算法,并在公开数据集和实验室收集的千万量级的大规模数据集上进行了实验,并实现了一个商标检索系统。具体地,本文的主要内容如下: (1)针对商标图像的局部匹配问题,本文采用一系列预处理方法,将图像边缘图分割成几个部件,再提取RIDE SIFT特征,并使用FV算法进行聚合描述,在公开数据集METU v2上的实验结果显示,该方法为当前性能最好的方法,甚至胜过一些深度学习方法。 (2)针对商标图像的语义相似问题以及纯文字型商标图像检索问题,本文采用深度学习方法提取CNN特征。主流的CNN网络和传统SIFT特征无法很好地表征纯文字型商标图,本文采用一种用于手写汉字识别的HCCR CNN,提升了网络的文字表征能力。 (3)针对数据量大时检索难、检索慢问题,本文采用了IMI索引加上OPQ特征编码的方法,OPQ编码能对特征进行降维并量化至汉明空间,IMI索引将传统KNN检索转变为ANN检索,保证精度的同时大大提升了检索速度。 (4)在Windows平台上使用C++实现了一个商标检索系统,并且本文提出的检索架构已经投入用于商标侵权检测的商业应用(详见标掌柜网址http://www.biaozhanggui.com/),目前上线半年,运行良好。