论文部分内容阅读
图像凭借其直观丰富的视觉呈现和低廉的传输代价,在信息传播过程中获得了广泛的应用。然而,网络中图像的不当使用现象,如非法散布、篡改等,也给版权保护、网络监管等任务带来了不便,引发了新的社会问题。图像拷贝检测技术是一项在数据库中检索图像拷贝的技术,作为解决上述问题的重要手段,它已经成为计算机视觉领域中的研究热点。近年来,随着网络中图像数量的爆炸式增长,图像拷贝检测技术面临着新的挑战。本文针对面向大规模数据库的图像拷贝检测中的关键技术进行了深入的研究,并取得了以下成果: 1.基于稀疏表达的分级词袋模型针对传统词袋模型中词表训练开销较大、特征量化误差较大的问题,本文提出了一种基于稀疏表达的分级词袋模型。该模型以稀疏编码为基础生成大词表和进行特征量化,节省了词表的训练和存储开销,减小了量化误差。在此基础上,本文进一步提出了不同粒度的两级图像指纹特征,分别用于对大规模图像数据库进行快速筛选和精细匹配,以提高检测速度和精度。 2.稀疏索引 为在大规模数据库中进行高效地检索,本文提出了一种基于稀疏表达的高维索引方法,实现了对检索空间的有效划分。该稀疏索引通过字典学习和稀疏编码生成,从而保证了索引的数据相关性。在此基础上,本文进一步提出了多探测策略,通过调节多探测的哈希桶数量来对稀疏索引在召回率和生成的候选集规模之间进行折衷。 3.大规模图像拷贝检测系统在上述研究工作基础上,本文研发了一个大规模图像拷贝检测系统。该系统以稀疏索引划分检索空间,然后以两级特征对候选集进行筛选和匹配,从而保证了系统的检测速度和精度。在百万级的图像数据库上,本文与基于传统词袋模型的方法进行了对比实验,实验结果表明,本系统在检测速度和检测结果的平均精度(mAP)上均优于对比系统。