大规模图像数据中相似图像的快速搜索

被引量 : 0次 | 上传用户:fankyxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模图像数据中的相似图像搜索是计算机视觉研究中的经典内容,也是近年来有着广泛应用的一个课题。相似图像搜索所要解决的问题是,给定一个查询图像,需要从图像数据库中检索到与之内容相同或相似的图像。当数据库中图像的数据规模很大时,一个相似图像搜索系统面临着搜索速度、存储代价、返回结果准确性等诸方面的问题。其中,搜索的实时性往往是大规模图像搜索中的关键问题。本文围绕在大规模图像数据中快速搜索相似图像这一问题,首先介绍了目前在图像表达上的主流图像特征,然后介绍了作者所做的三个方面的研究工作。第一方面是图像数据集的高效创建。目前常用的深层图像特征,需要使用大量的图像数据进行训练。作者基于自动编码器中数据的重建误差对数据是否为杂质的指示性作用,提出了可以使重建误差具有更强的指示性的算法。用该算法可以自动去除图像集合中的杂质,得到干净的数据集用于深度学习的训练。另一方面是关于图像特征的倒排索引,作者提出了一种联合倒排索引方法。在传统的倒排索引方法中,对图像特征空间的多次划分都是随机的或独立的。而在联合倒排索引中,作者考虑了图像特征空间多次划分之间的互补性,并对之进行优化。通过联合倒排索引,从上亿图像中单机搜索出相似图像候选集仅需毫秒量级时间,并且返回结果的准确性较目前主流算法大大提高。还有一方面是在图像特征的快速排序中,作者提出了稀疏投影编码算法。在图像特征的快速排序的研究中,近年来主流的做法是将图像的特征进行哈希编码,通过计算哈希码之间的汉明距离来对候选图像进行排序。由于哈希码存储空间小并且汉明距离可以快速计算,因此这种方法被广泛采用。但是,在进行哈希编码时,目前主流方法均引入了一个稠密的正交矩阵对图像的特征进行投影,使得编码步骤耗费大量时间。尤其是当图像特征维度变大时,稠密投影将耗费更多时间。本文提出采用稀疏矩阵进行投影以减小计算代价,这样不仅可以加快哈希编码的速度,而且可以在一定程度上缓解优化模型中的过拟合问题。在以最小化编码误差为目标求解这个稀疏投影矩阵时,作者采用了分离变量法:引入辅助变量并惩罚该辅助变量与真实变量之间的差异。采用迭代法优化这个问题,最终求得一个稀疏的矩阵用于图像特征的投影和编码。作者在多个数据集上进行了各种定量实验,实验结果证明了以上工作相对于目前主流算法的优越性。另外,基于所提出的联合倒排索引算法和稀疏投影编码的算法,作者在大规模的图像数据上实现了一个相似图像搜索系统。在该系统上的定性实验的也证明了本文所提出算法的有效性和可行性。
其他文献
随着长输管道的不断发展,长距离、大口径、高压力的管道越来越多,管道运行中存在抢修、分输改造等作业,停输将对管道运营带来经济损失和安全隐患。本文主要介绍了不停输带压
我国对文学伦理的研究古已有之,但一直未形成一个完整的学科体系。近三十年,国内文学界又掀起了一次关于文学与伦理的研究热潮,涌现出了一大批理论文章和著作,并取得了一定的
<正>PPP模式的选择需因地制宜,建议合作者监督东道国的内外部环境,以明确合资方式中成败的关键因素。内部环境包括与合作公司关系、结构特征;外部环境包括东道国的环境和项目
真空玻璃是玻璃工艺与材料科学、真空技术、物理测量技术、工业自动化及建筑科学等多种学科、多种技术、多种工艺协作配合的硕果。近年来对真空玻璃的研究不断升温,文章主要
日本的福岛核事故,天津的危险品爆炸等重大的灾难性事故发生后,研发出一种能够在危险环境下救灾救援机器人,成为机器人研究领域的热点和难点,也是重大基础性的课题,具有十分
描述了下一代基于OFDM的高速蜂窝因特网体系结构,分析了该体系结构中物理层使用OFDM技术的优势及目前研究的主要问题,同时也讨论了网络级的TCP/IP协议应用于无线链路时面临的
由于防辐射驾驶舱是对原有挖掘机驾驶舱结构进行的改进,改进前后驾驶舱框架结构强度发生了相应的变化,因此需对其结构强度进行分析与校核。运用ANS YS Workbe nch对防辐射驾
针对塔里木油田井漏现象的普遍性、多变性和复杂性等特点,亟待找出针对井漏的行之有效的堵漏技术。通过对已有堵漏技术的现场应用和相关文献调研,并在对塔里木油田的井漏特征
进入21世纪以后,大学生的英语入学水平有了明显的提高。但很多大学新生在英语学习方面存在观念滞后,缺乏有效的学习策略,他们对英语学习缺乏信心、兴趣、动力,导致他们不能适
<正>2005年农村税费改革特别是取消农业税、农业特产税后,财政所的职能发生了很大的变化,新的职能对工作人员提出了新的要求。目前财政所人员状况如何,能否适应新职能的新要