论文部分内容阅读
近年来,随着互联网和大数据的发展,服装电子商务的发展愈加蓬勃,互联网的服装图像数量迅速增长,越来越多的人选择了网上购物来替代实体店购物,因此用户对服装图像检索的需求也越来也大。目前,服装图像检索方法主要有以文搜图和以图搜图的两种方法。以文搜图的服装图像检索方法由于关键字的表述能力有限,包含的服装特征也有限,因此在面对海量数据时,以文搜图的服装检索方法日显疲态。而目前的以图搜图的服装检索方法依赖于服装图像的语义信息,而这些语义信息的标注具有主观性没有一个统一的标准,且包含的信息量同样有限,在面对大数据时则差强人意。所以,对提升服装图像分类检索方法性能的研究具有重要意义。本文基于深度学习与传统特征对服装图像的分类和检索技术进行研究,主要完成以下工作:1.以图搜图的关键一步就是提取服装图像的特征向量,本文首先介绍了图像特征的传统表示以及深度学习表示。在传统特征表示中,重点介绍了HOG(Histogram of Oriented Gradient)特征、颜色直方图特征、边缘直方图特征、Daisy特征以及Gabor特征;在深度学习表示中,介绍了深度学习的理论基础以及常见的神经网络结构。2.服装图像除了颜色等低层信息外,还拥有一些特殊的属性信息,比如衣型、衣长、纹理、袖型,领型等,而服装的款式正是有这些属性表达出来的。为了对这些特殊的服装属性进行分类,本文训练了一个深度卷积神经网络进行分类工作,在提取服装图像特征时,利用了基于卷积神经网络的服装属性多标签分类模型。由于服装数据集中具备每种特殊属性的服装数据分布并不均匀,针对这一问题,本文采用迁移学习方法重新训练网络模型。实验证明,训练出的网络模型可以准确提取出属性特征并表示,且获得了较好的属性分类结果。3.服装图像容易因背景、光照、形变等的因素,影响提取的服装图像的特征向量。针对此问题,本文引入了相似性度量学习,从而优化神经网络提取到的服装特征。实验结果表明,经过相似学习优化后的检索效果的确有所改善。4.利用深度学习提取的特征均是深层语义特征,缺乏浅层特征,这使得检索的效果不够理想。对此,本文提出了与传统特征相结合的Re-ranking图像检索方法。本文将卷积神经网络提取的特征和传统方法提取的图像特征结合进行Re-ranking,从而对初步检索结果进行精确定位、筛选和排序。实验结果表明,该方法有效提高了服装检索的准确性。