论文部分内容阅读
基于内容的图像检索在通用图像检索引擎,平面设计产品版权保护,视频对象跟踪等应用中拥有广阔的应用前景,同时在不良信息过滤等安全领域也发挥着重要的作用。本文对基于内容的图像检索技术进行深入的研究,使用了SIFT局部特征、LSH高维向量索引以及多视几何分割等技术设计并实现了支持移动终端的图像检索引擎(MOVER)原型系统,同时开发了自动化测试框架,并对原型系统进行了多项改进。首先,本文系统使用分布式架构设计以提升系统检索性能与容量。其次,本文系统借鉴和采用了以下方法:1、基于SVM和Bag of Words与朴素贝叶斯分类结合的数据库图片预分类;2、基于模拟检索图片与多视运动分割的图片稳定特征点筛选,对LSH高维向量索引进行优化;3、基于主分量分析的图像特征精简;4、基于多特征组合的图像索引构建方法,弥补单一图像特征在描述能力上的不足;5、使用基于min-Hashing的索引构建方法,以支持大量数据库图片的检索;6、使用机器学习的方法对图片相关度评分方法进行改进;7、使用自动化测试的方法,通过对日志的分析来快速定位系统的缺陷。本文对MOVER检索系统进行了实验分析,统计了系统的准确率与完整性,对于具有两千张左右图片的分布式检索系统,在完整性不低于50%的条件下,准确率可达80%以上。对于中等大小的拍摄图片,整个系统的平均检索时间大约在八秒以内。通过使用模拟检索图片及多视运动分割优化图像索引,最终能够对索引优化13.83%,而系统准确率的下降程度不到1.5%。