基于部件检测与分割的服装图像检索研究与应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:ah51616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调研了目前比较流行的服装图像检索方法,并对其优劣点进行了深入研究,主要完成了以下工作:首先,本文通过对服装实例分割数据集iMaterialist Fashion进行转换,并进一步将衣袖分为短袖、中袖、长袖等类别,在较大样本服装图像标注数据集的基础上,训练Mask R-CNN以建立服装图像检测与分割的深度学习模型,从而实现服装图像的检测与分割。利用自训练的Mask R-CNN模型提取服装主体图像、衣领图像、衣袖类别、口袋位置,同时对衣袖类别、口袋位置进行编码以便于相似性比较。其次,在服装图像检索中,本文首先利用Mask R-CNN对图像进行检测与分割得到服装主体、衣领部件、衣袖类别和口袋位置等信息;然后采用VGG16对服装主体与衣领部件提取512维的特征;基于这些信息,将待检索服装与数据库中的服装逐一计算相似度。相似度的计算方式为服装主体及衣领的512维特征的余弦相似度以及衣袖、口袋相似度的加权和,其中衣袖是比较其类别的相似性,口袋是比较其位置的相似性。根据相似度的降序排列,向用户呈现检索结果。实验结果表明,该方法可以关注服装整体以及各个部件,从而能够实现服装款式或风格的检索。并且允许用户调整相似度的权值,可以返回最符合用户个性化需求的检索结果。最后,针对目前服装图像检索中忽略服装部件相似性的问题,本文设计并实现了基于部件检测与分割的服装检索方法的商城系统,通过使用本文提出的检索方法来实现服装商品检索。整个系统使用前后端分离的技术实现,客户端采用小程序框架,服务端采用Spring Boot框架,充分的考虑到了系统的跨平台性和横向扩展性。系统的功能主要包括登录注册模块、商品浏览与检索模块、购物车及支付模块、个人中心管理模块等。
其他文献
连城地瓜干是连城县传统的地方特色产品,位居"闽西八大干"之首,已有300多年的历史,早在清代,连城红心地瓜干已成为"贡品",取名为"金薯片"。连城地瓜干色泽鲜亮,香气纯正,口感甘醇、柔软细腻、有韧性。连城县地处福建省西部山区武夷山脉南段,属中亚热带气候区,雨水及光照充足,有效积温长,
期刊
随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义
深度神经网络的运算通常都依赖于高性能的显卡,大容量的存储,优良的散热系统等,这些设备的高昂成本严重制约了其进一步发展和推广。同时,性能越优异的网络,其参数量和模型复杂度也越大,而一般的计算设备几乎无法运行。因此,对深度神经网络的压缩与加速成为业界的研究热点,但是对复杂模型进行轻量化设计,通常又会导致模型精度的损失。面对模型的轻量化导致精度下降的问题,本文以深度残差网络Res Net为例,对深度神经
骨龄是一种对骨骼成熟度的解释,通过它可以确定人类的生物学年龄,判断儿童的发育情况。骨龄应用诞生至今已有几十年之久,它不仅在儿科的临床环境中起着重大的作用,其应用已延伸至多个领域。目前,众多专业医师仍采用传统的骨龄评估方式,例如评分法、图谱法等。传统的骨龄评估方式耗时费力,容易受到主观因素的干扰且难以普及。在深度学习兴起之前,为克服人工骨龄评估带来的问题,人们尝试使用传统的图像处理方式来辅助医师进行
甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节
移动互联网的飞速发展和智能终端设备的广泛使用使人们的工作和生活方式逐步被网络化,“远程”和“共享”成为人们社会生活方式的主要组成部分。而且随着计算机科学、通信等传统产业的融合,多媒体正逐步深入人类社会的每一个角落。图像是一种可视化的多媒体信息,是最主要的多媒体形式之一,也是传递信息的重要媒介之一。因此,图像传输的安全性引起了研究者的关注。目前保证图像安全传输的方法有两种:图像加密和信息隐藏。本文主
目前肝脏恶性肿瘤依然是世界上最普遍的癌症之一,它也是人类死亡的主要原因,对人类健康构成了巨大的威胁。为了有效降低癌症死亡率,患者依然需要提前对身体进行全面的检查以及尽早接受治疗。然而由于肝肿瘤与其周围软组织之间的对比度较低,分界不明显,而且对于不同的病人,肝肿瘤的形状,体积,数量和位置等差异明显,同时多种扫描方案导致CT图像存在噪声干扰等问题。由于肝肿瘤分割难度较大,仅仅依赖医生的肉眼检测很难得到
速度快、准确度高的车辆检测系统不仅能够帮助交通指挥员加强对道路交通系统的管理,而且能够在交通事故等紧急事件中快速提取出事故车辆的信息,提高处理紧急事件的效率。可见,提高车辆检测的精度和速度对增强城市道路交通管理系统具有重要意义和应用价值。本文深入研究了Mask R-CNN网络模型,对其主干网络和Ro I Align进行改进,提出了CA-PS Mask R-CNN网络模型,完成以城市道路为实际背景的
随着国家经济实力的腾飞和科学技术的突飞猛进,各行各业对数据重视程度日益提高,大量生产、交易、医疗等数据被收集起来,用于企业产品升级或服务转型等诸多方面研究。面对具有高度复杂、体量大、易变性等特点的海量数据,如何对其进行精准检测和快速分析,从中挖掘出具有的潜在价值,已成为当今数字化时代研究的热点问题。作为大数据领域中的一个重要研究分支,时序数据的异常检测与快速分析技术主要利用整体数据的分布状态,找出
由于当下的中小学生握笔手势不规范,导致写字质量不高、坐姿不良、眼睛近视以及手指关节增生等问题,对其身心健康造成不良影响。针对握笔手势的问题,我国研究者们已经对其进行了较多的理论研究,国家也出台了《关于在中小学加强写字教学的若干意见》等一系列文件,不仅强调了学生使用正确的握笔手势进行书写的重要性,而且明确定义了中小学生正确书写时的握笔手势。然而当前的握笔手势和书法教学主要采用面授和视频教学,缺乏自动