论文部分内容阅读
近年来互联网和电子商务得到了高速的发展,人们的购物方式逐渐从线下实体店转移到了线上网店,成为了主流的购物方式。其中,电子服装行业的线上交易量呈逐年增长趋势,为了满足消费者对服装的需求,电商平台需要不断增加的服装种类和数量,这将导致检索引擎准确地检索服装商品的难度越来越大。目前服装图像检索方法主要分为两种:基于文本的方法和基于图像内容的方法。基于文本方法的缺点:消费者与服装商家之间的文字描述可能不一致,存在个体理解上的差异,而且文字信息难以详尽的描述服装图像的内容。基于图像内容方法的缺点:传统图像内容的服装图像检索方法过分依赖对图像特征的取舍,需要研究人员有丰富的行业经验。因此,探索研究一种有效的服装图像检索方法具有实际意义,鉴于近年来深度学习在图像领域取得的突出成绩,本文提出了一种基于卷积神经网络的服装图像检索方法。本文经过调研总结当前服装图像检索研究现状的前提之下。首先针对服装图像深度卷积特征信息丰富度低导致检索效果差的问题,提出一种多尺度SE-Xception的网络模型,实验结果显示该模型在服装图像分类和检索任务中的效果均优于常用的CNN模型。本文检索主体框架借鉴了深度二进制哈希快速检索方法,并结合服装图像特点进行了相关调整和改进:为了缩小服装图像检索池的检索范围,使用了模型输出的服装语义属性;为了缩小同件服装商品图像的特征距离,扩大与其他服装商品图像之间的特征距离,在损失函数中加入三元组损失;为了更进一步的提高检索准确率,使用PCA降维后的深度卷积融合特征进行相似度计算。本文主要的工作内容和研究成果包含如下几点:(1)提出多尺度深度可分离卷积。针对深度可分离卷积尺度单一、特征信息丰富度低的问题,提出一种多尺度可分离卷积。首先将结构中的3×3卷积核替换为1×1、3×3、5×5卷积核以及Max Pooling池化。然后为了降低计算量,在多尺度卷积结构之前使用1×1标准卷积降低通道个数。经过多组不同组合的多尺度卷积实验显示,多尺度可分离卷积能够有效提高服装图像分类检索的准确率。(2)设计多尺度SE-Xception模型结构。为了进一步提升模型的分类效果,将多尺度可分离卷积、Xception模型与SE-Net模型进行有机的结合。实验结果显示,本文模型的分类性能效果强于其他模型。(3)整体检索框架结合服装图像的特点和深度二进制哈希检索方法。目前服装图像的数量巨大,相比人工特征,使用深度学习模型自动学习数据分布提取特征的方式更为方便、有效。另外,训练模型时加入Triplet Loss,大幅度地提升了检索准确率;使用融合了中层与深层的卷积特征,进一步提高了检索效果。(4)比较了 VGG模型、残差模型、Xception模型、多尺度Xception模型以及多尺度SE-Xception模型的服装图像检索实验。实验结果表明,基于多尺度SE-Xception模型的服装图像检索优于常见的CNN模型。