基于深度卷积神经网络的跨域服装检索系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:mydoself
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年在线购物发展迅猛,已经成为人们生活中密不可分的一部分,而服装是其中最重要的类别之一。传统的检索方法主要通过匹配用户输入的关键词与商品库中物品的名称进行检索,关键词的检索粒度比较粗,而很多时候用户需要寻找一件特定花纹的衣服或者某件电视剧里明星穿的同款衣服。这些需求催生了基于内容的服装检索算法的研究,即用户通过输入所想购买服装的图像进行检索,这能大大提高了在线购物的便利性。本文核心要解决的问题是:如何基于用户拍摄的服装照片去检索在线购物网站上类似甚至同款的服装,我们将其建模为一个跨域服装检索问题。通常来说,用户拍摄的照片由于不受任何限制,人物姿势各异、角度、光照等差异大,相反在线购物网站上的服装照片由专业人士拍摄,背景干净、光线充足、模特姿势相对固定。如何最小化上述差异,提高两组服装的匹配准确度,是跨域服装检索面临的挑战。具体来说,本文重点研究了跨域服装检索准确度的提升和面向大规模图像检索时速度的提升这两大问题。针对准确度的提升,本文先介绍了基于深度卷积神经网络的度量学习模型,即Triplet网络模型。接着介绍了基于深度卷积神经网络的度量学习模型中现存的两种策略,即两域共享参数和两域不共享参数。考虑到参数共享模型无法很好地体现两域的差异性,参数不共享模型的参数会使参数翻倍、降低模型泛化性的问题,基于深度卷积神经网络低层神经元学习到的是基础性特征,诸如边和颜色等,高层神经元学习到的是语义特征的特性,本文提出了参数部分共享模型。在真实服装检索数据集上的实验结果证明,参数部分共享策略检索准确率最高或与最高相当。针对检索速度的提升,本文介绍了搭建服装检索系统原型的全过程。该系统将深度哈希与参数部分共享深度卷积神经网络跨域服装检索模型相结合,使得学习出来的特征哈希为0或者1,在大幅度降低图像特征存储的同时,大幅度提高检索速度。该系统原型可以通过网址:http://202.120.39.165:9999/retrieval访问。本文的深度哈希检索模型的关键点在于Triplet网络结构模型和目标函数,该目标函数包括三个损失函数,即Triplet损失函数、哈希误差损失函数和特征向量信息熵的损失函数。优化Triplet损失可以让深度哈希检索模型中的特征网络能够学习到适用于检索的特征;优化哈希误差损失使得深度哈希检索模型中的特征网络输出的特征向量的值尽可能接近0或者1;最大化特征向量信息熵的目的是确保哈希后的哈希码具有最大的熵,以携带最多的信息。
其他文献
本文以双重双面法加工的弧齿锥齿轮为研究对象,对大轮双侧齿面的啮合性能进行了设计。以完全共轭齿面为大轮的基准齿面,通过预置双侧齿面啮合性能,确定了齿面误差,并利用Ease
微泵在微流体系统中扮演着至关重要的角色,其性能的高低往往能够直接决定微流体系统整体的表现。微泵在药物检测、生物医学、芯片试验室系统以及微电子芯片冷却系统中具有广泛的应用。在各种新开发出的微泵中,基于逆压电效应的无阀压电微泵以其结构尺寸小、能耗低、没有阀片的磨损和疲劳等优点逐渐成为研究的热点。本文在附壁射流无阀压电微泵的基础上提出了一种结构紧凑、性能更优的双腔串联附壁射流无阀压电微泵,这种串联微泵将
叶轮是泵内对介质做功的核心部件,叶轮的结构对泵内流动的影响较大。在旋转的叶轮和复杂的过流部件影响下,泵内的流动结构尺度多、形状复杂。流动结构是决定泵内的压力分布和诱发压力脉动的重要因素之一。泵内压力脉动会引起振动和噪声,加剧泵运行的不稳定性。从叶轮结构的角度出发进行泵内非稳态流动及压力脉动特性的研究具有重要的意义。本文综合采用数值模拟和实验研究手段,对双蜗壳泵内部的流动和压力脉动进行研究,采用不同
目的:本研究旨在探讨孕酮对戊型肝炎病毒(HEV)感染细胞中Ⅰ型IFN信号通路的机制的影响,为孕妇感染戊型肝炎的临床治疗和预防控制提供理论基础。方法:HEV感染A549细胞后,荧光
辉铜山铜矿位于哈萨克斯坦板块与塔里木板块对接部位。三叠纪晚期板块碰撞和对接作用,导致大规模岩浆侵入,大面积燕山早期砖红色花岗岩侵入中、下奥陶统花牛山群大理岩中,在
水下声学通信网络因其物理传播的方式和介质的不同,相较于陆地上的无线通信网络具有可用带宽有限,传播时延长,通信速率低,受噪声干扰明显的特性。而水下应用随着各种相关领域
迭代译码技术能极大提高系统性能,在信道译码和多用户检测中得到了广泛应用。但传统译码算法往往只能产生一组候选序列进行CRC校验,不通过校验则只能重传,造成传输资源浪费。本文主要研究利用CRC辅助进行图上迭代译码的方法。Turbo-hadamard是一种性能优异的低码率码,它采用固定次数的迭代译码技术。本文提出了一种低复杂度的CRC辅助turbo-hadamard迭代译码算法,将CRC检错与迭代译码过
清代蒙旗历史地理是中国边疆和民族史地研究及蒙古学研究领域的重要组成部分,其中卓索图盟喀喇沁左旗历史地理研究是中国边疆地区历史地理研究和内蒙古历史地理研究中不可缺少的课题部分。本文以清代卓索图盟喀喇沁左旗的历史地理为研究对象,利用清代卓索图盟喀喇沁左旗和喀喇沁中旗蒙古文档按并结合清代官修的历史书籍和清代喀喇沁左旗地图,对喀喇沁左旗行政建制变迁、地界、山川地理、人口、开垦、寺庙及驿站的历史演变问题,进
自从上世纪90年代末以来,随着全球市场环境的重大变化,企业的竞争形式已经从单一企业之间的竞争转变成由多个企业组成的供应链与供应链之间的竞争。为了保证交易成功和提高供
阜康断裂带及其北缘下侏罗统八道湾组煤炭资源及煤层气资源丰富,预测煤炭资源量84亿吨,预测煤层气资源量约450亿方。阜康断裂带中部的白杨河、CSD井区更是率先获得了我国中-