论文部分内容阅读
近年来随着互联网的不断发展,人们已经开始从到实体店购买商品转向通过网络的方式购买商品。由于网络上的商品种类繁多且数量太多,用户很难快速找到自己所需要的商品。如何从海量的商品中快速找到符合自己所需要的商品已成为人们需要解决的问题。当前一些互联网公司向用户提供了一些查找近似商品图像的检索服务满足用户的检索需求,因商品图像的文本描述信息错误、图像背景噪声等因素的影响使得商品图像的检索服务无法满足用户的实际需求。同时如何对同一幅图像中的多个目标对象进行交互式检索也是人们亟待解决的问题。为了解决上述问题和提高商品图像的检索性能,本文针对衣服、包等具有复杂背景的商品图像提出了一种交互式商品图像检索方法。本文的主要内容和贡献如下:第一,提出了一种交互式图像分割算法,该算法充分利用用户选择待提取商品所在图像中的矩形区域位置信息,其主要思想是假设图像中的像素距离矩形中心位置越近则将此像素视为目标前景的概率越大,相反则此像素为图像背景的概率越大。然后在GrabCut算法的基础上结合空间位置信息修改了仅仅依靠颜色的高斯混合模型,从而提高了目标前景提取的准确度。第二,提出了一种无监督商品图像分割算法,该算法利用人脸检测方法确定待提取目标可能存在的区域;对目标对象存在的区域进行简单分析并判断此检测区域是否具有合理性。若目标区域检测正确则对图像背景及可能的图像前景分别构建高斯混合模型;利用Gibbs能量函数迭代最小割使得其能量达到近似最小而实现图像分割。若目标区域检测错误或未检测到人脸则利用主目标提取算法提取商品目标。第三,提出了一种交互式商品图像检索方法,首先利用无监督商品图像分割算法过滤后台数据库中的图像背景噪声,并对过滤图像背景之后的商品图像提取颜色特征、纹理特征分别构建特征数据库;然后采用交互式图像分割算法提取待检索商品目标对象,并对待检索的商品目标提取颜色特征、纹理特征;最后根据特征匹配计算得到商品目标的检索结果。第四,实现了交互式商品图像检索系统。系统的后台图像数据库包含原始图像和分割图像两种图像数据集总共240万;并能在单台计算机上实现实时交互式商品图像检索。