基于深度学习的商品识别技术研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:y58jm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们生活水平的提高以及商品的种类的增加,使得消费者对于商品的要求也越来越高。其中,琳琅满目的商品种类和对商品五花八门的描述,使得对于商品识别的研究也有了越来越重要的现实意义。本文基于深度学习的方法对商品图像识别以及商品图像中的文本识别进行了相关研究,与传统的图像识别以及文本识别算法对比,利用基于卷积神经网络的图像及文本识别算法进行分析,提出本文研究方法。1)为了降低噪声对图像识别准确率的影响,本文将深度残差收缩网应用到商品图像识别。该算法模型主要以深度残差网络为主结构,然后将软阈值函数及注意力机制融入网络模型中。其中,软阈值函数可实现将通过注意力机制注意到的不重要的特征置为0,以此来降低噪声信息的干扰,提高商品图像识别的准确率。实验对包含了51种商品的数据集进行训练,将深度残差收缩网络与Res Net、Alex Net、SENet网络分别进行比较。实验结果表明,深度残差收缩网络不仅可以提高商品图像识别准确率,同时还提高了模型的运行速度。2)本文提出了CTPN+CRNN商品图像中文本检测与识别模型。首先CTPN文本检测模型以VGG16为基础,借助文本构造的算法,对包含了10048张商品图像数据集进行训练。该算法先将大的文本行先拆分为小文本框进行特征提取,然后在利用Side-refineme优化算法实现文本框检测。通过对训练以及测试结果的分析得出,该算法对于文本框的检测具有良好的效果。然后CRNN的文本识别算法模型,对包含了858750张中英文文本的图像进行训练测试。该算法利用双向LSTM,结合文本左右的信息实现对文本的推测识别,同时该算法结合了CTC损失函数,对于不定长的文本识别具有其独特的优势。最后将文本检测与识别结合,实现端到端的商品图像文本识别。通过对实验结果分析,对于文本识别的准确率在33%左右,模型可以识别出文本内容,实现了文本识别的功能,但效果有待提高,期待下一步的工作来提高其识别的准确率。3)为了整体描述商品识别模型训练系统所要实现的功能特性,为程序开发者整理出一套软件设计思路、实现步骤、视图部署及各种技术的解决方案,本文实现了商品识别模型训练系统。该系统通过模块化的思想,方便系统扩展和软件测试。同时用户可以通过接口来调用该系统,实现自己的商品识别模型训练。
其他文献
以信息技术赋能传统产业是国家战略,将自然语言处理技术应用于旅游领域,从而推动智慧旅游建设,成为一个重要的应用研究方向。旅游问答系统是智慧旅游建设中的一项重要内容,它旨在应用自然语言处理技术回答用户提出的问题。旅游作为一种体验型产品,其问答系统反馈带有真实主观观点的答案对用户更具亲和力。为更好地回答旅游领域的主观型问题,本文在抽取主观型候选答案的基础上,利用情感分析技术获得候选答案的情感信息,以便获
山西有着深厚的历史底蕴,是中华文化的重要发源地之一,山西博物院青铜文化是其中重要的组成部分。目前,山西博物院在文创产品开发领域尚处在探索期。为了进一步弘扬青铜文化,针对山西博物院青铜器文创产品开发进行研究是颇有必要的。笔者以山西博物院鸟兽形青铜器为文创开发原型,建立系列文创品牌《铜趣》。本文采用文献研究法、实地调查法对山西博物院青铜文化脉络进行梳理,采用问卷调查法对《铜趣》系列文创品牌进行了受众调
当今时代,信息技术日新月异,地区间的贸易往来趋于频繁,企业为在市场竞争中占据一席之地,提升自己的竞争优势,纷纷将物流外包,这就使得物流业蒸蒸日上。我国物流业在发展中也没有落下前进的脚步,尤其是十九大以来,智慧物流、区块链等平台经济方兴未艾,很大程度上推动物流行业的数字化变革,这就促使物流企业不得不面临一系列的重大改革。物流业作为新兴产业存在成本高、能耗大、污染多等一系列问题,这就导致我国物流业虽然
新型城镇化是现代化进程中不可或缺的关键一环,其作为国家的一项重要发展战略,在实现全面小康、推动经济高质量发展的道路上发挥着不可替代的核心作用。同时物流业在近年的发展中保持着强劲的增长势头,逐步成为我国经济发展的重要驱动力。新型城镇化政策涉及领域广阔,新型城镇化的蓬勃开展必将为物流业发展打开新的发展空间,因此有必要对新型城镇化背景下物流业的发展成效进行深入研究。关于新型城镇化与物流业的相关研究屡见不
随着山西省经济的快速发展、基础设施的不断完善,物流业迎来了迅猛发展的契机,相关部门和各个企业也越来越关注物流业的发展状况。经过多方的努力,山西省物流业正逐渐改变“散、小、乱、差”的局面,不断向现代物流业转变。但由于种种原因,山西省物流业仍存在诸多问题,如:物流成本一直居高不下,占山西省GDP的比重一直高于全国平均水平;物流企业的竞争力有限、信息化程度不高、资源整合的能力差等。究其原因,山西物流标准
谣言的传播过程往往存在一些随机扰动,这些扰动时刻影响着谣言的传播趋势,因此研究随机扰动下的谣言模型,对控制谣言的传播具有非常重要的意义.基于此,本文主要研究随机扰动下两类谣言模型的渐近行为.第一章,介绍了随机谣言模型的研究动态,并给出本文主要研究的内容.第二章,建立了下列随机谣言模型(?)首先,利用停时证明了该模型全局正解的存在唯一性;然后通过构造Lyapunov函数研究了该模型无谣言平衡点的p阶
交通基础设施是经济社会发展的先行资本。交通基础设施的建设和完善能够促进要素在空间范围内迅速流动,加快人力、物力、资本的自由流动速度,降低运输成本,提高流通速率。物流业的快速发展依赖于物流效率的提高,交通基础设施作为物流要素流通的载体,在一定程度上形成了物流业发展的合力和动力,所以研究我国交通基础设施对物流业发展的影响有着很强的现实意义。基于交通基础设施的外部性和网络状特性,不考虑空间效应会在一定程
机器自动情绪识别因其在人机交互中的潜在应用而受到越来越多的关注。目前,情绪识别可通过多种信息来实现,如面部表情、语音语调、身体姿态以及人体各种生理信号等。相比较而言,皮层脑电作为中枢神经生理信号,调节与情绪相关的递质分泌和大脑的边缘系统,能够客观反映人的情绪状态变化,从脑电信号中提取有效特征并进行情绪识别在人机交互和精神心理疾病监测中具有重要意义。论文针对维度情感模型的构建以及脑电信号情绪识别中特
5G网络发生故障可能影响全网稳定性和服务质量,其故障发现与修复是5G网络运维管理的关键之一。基于历史故障发生前的网元关键绩效指标(Key Performance Indicator,KPI)变化以及设备告警信息、指标统计特征、自动异常检测、指标关联特征、告警编码特征等,提出了5G核心网网元多维特征融合故障预警方法,构建了多维特征空间训练故障预警模型。最后,针对现网运行数据,选取了6类网元并进行了实
图像的深度估计是计算机视觉领域一个重要的研究课题。挖掘二维图像中的深度信息,可以帮助计算机理解场景的三维结构,在智能机器人技术、虚拟现实、增强现实、场景的三维重建、汽车自动驾驶等众多领域都有广泛的应用。相较于基于双目、多目的深度估计方法,基于单目图像的深度估计对设备和环境要求较低且易于实现,因此具有更加广泛的应用价值。然而,只通过单个视角的二维图像估计三维的立体信息,从几何计算的角度来看是非常巨大