论文部分内容阅读
图像检索一直是多媒体技术领域的研究热点,同时也被广泛地应用在搜索引擎、商标检索和电商贸易等领域。本文的应用背景是电商贸易下的酒瓶检索,由于酒瓶生产可以后期上色,因此形状是最主要的区分特征,而分割是形状特征提取的必要步骤。本文所针对的数据集包括数据库图片和检索图片。数据库图片存在渐变背景噪声、横线噪声及弱边缘的分割难点。由于酒瓶光滑、透明及光照不均匀等原因,检索图片常常具有很复杂的环境条件:反射、折射产生的高光以及酒瓶透明、物体阴影导致的灰度极度不均匀,以及弱边缘和边缘缺失。本文数据集形状还具有类内差异大、类间距离小的难点,并且实际应用系统要求在30秒内返回前16个相似图片。本文分为数据库图片分割、检索图片分割和形状检索三大步骤,每个步骤分别对上述的难点进行了研究与解决。本文的主要的贡献如下:1、针对数据库图片的分割难点,对区域生长法进行了改进。该方法使用前景概率图对区域的生长准则进行自适应缩放,既保留了区域生长法能滤除渐变背景噪声的特性又能分割弱边缘,同时使用闭操作处理横线噪声,最终完成了数据库图片的分割。2、针对检索图片的高光问题,提出了一种反射、折射通用的高光区域检测方法。本方法根据反射和折射高光的亮度、区域相似性进行高光区域的初始化和筛查,对检测出的高光区域进行高光去除,作为检索图片分割的预处理以缓解灰度不均匀问题。3、针对检索图片的复杂环境条件及时间限制,提出了基于图割一步优化的GAC算法。本算法将基于GVF力场的GAC模型离散化并映射成图中的边界项,使用改进的区域生长法生成初始概率图作为区域项的初始化,改善严重灰度不均匀的同时令整个模型可以一步优化。在检索图片上MIoU达到了91.03%,比One Cuts高36.36%,时间快了4.5倍,比GAC模型高11.23%,时间上最少快了386倍。4、针对本文形状检索难点和时间限制,提出了基于改进SC的词袋检索模型。首先提出了基于归一化残差编码的SC特征,使用采样点相对栅格中心的归一化二维残差对形状进行更精确的表示;然后将轮廓分成多个轮廓段,对训练图片所有轮廓段提取上述改进的SC后进行聚类、编码、池化及SVM训练;接着使用SVM有监督的权重生成对池化特征的权重,最终对池化后特征加权得到可用于快速检索的形状特征。本方法在检索数据集上达到了65.62%的mAP,相比排名第二的检索指标高出42.64%。本文工作为解决复杂条件下的分割以及类内差异小的快速形状检索的核心技术问题提供了可行性方案,为设计实用的酒瓶检索系统奠定了基础。