基于深度学习的超市商品检测与识别算法研究

来源 :河北经贸大学 | 被引量 : 0次 | 上传用户:zhubin19851021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前超市商品结算主要通过条形码或RFID标签技术实现,条形码需要人工扫描,结算效率低,RFID 标签成本高且不可重复利用。因此,如何利用人工智能技术实现超市商品的快速检测与识别以实现自动结算,成为近几年的研究热点。本文基于此展开研究,提出了一种基于深度学习的超市商品检测与识别算法,以降低商品结算成本,提高效率。
  针对超市商品种类繁多且商品特征存在局部性等特点,本文从应用场景出发,利用左、上、右不同方位摄像头采集传送带上商品不同面图像,引用基于相位相关和纹理分类的 SIFT 图像拼接算法对商品图像进行拼接处理,并通过图像检测算法检测商品的敏感特征和整体特征,最后利用基于随机森林的多特征融合商品识别算法实现商品的快速识别。
  本文主要研究内容包括以下三个方面。
  (1)针对Retinanet网络模型检测精度低、速度慢等缺点,提出了基于改进Retinanet的图像检测算法。该算法首先利用信息交互融合技术和改进的特征金字塔提取图像纹理特征及高频抽象特征,然后引用SSH检测网络代替原网络模型中的分类回归子网络,以扩大图像检测面积,最后利用加权损失进行回归,以提升图像检测效率。在RPC数据集中,相较于原始的Retinanet网络模型,本文算法的检测准确率提升了3.90%,达到96.69%;单张图像的平均检测时间由0.201s降低至0.145s,检测速率提升了27.86%。
  (2)针对商品外包装包含条形码、文本序列等高可信特征,提出了基于T-Densenet条形码检测算法和Wh-CTPN文本序列检测算法。基于T-Densenet 条形码检测算法通过增加Densenet网络层,并且重新调整anchor值以增大条形码覆盖面积,进而准确、快速地检测商品的条形码特征。Wh-CTPN文本序列检测算法通过对CTPN算法中的Side-refinement 公式重新进行定义实现文本序列信息的准确定位,进而提取出商品的商标、规格、文字描述等重要文本信息。
  (3)针对商品特征的多样性,提出了基于随机森林的多特征融合商品识别算法。该算法利用 Zbar 条形码识别算法、Simi-DenseNet-CTC 文本序列识别算法和 SCTDNet识别算法识别商品的条形码、文本序列和整体特征,并将结果输入随机森林商品特征分类器中进行分类识别,通过计算每个输入特征的预算分数,输出最优识别结果,最后通过商品画像库进行信息匹配,实现高效商品检测识别。在公共数据集RPC中,本文算法的商品识别准确率mAP50达到96.95%。在自制商品图像数据集中,本文算法相比原始的Retinanet算法、改进的Retinanet算法,商品识别准确率分别提高了6.11%和2.48%,达到97.81%;平均检测时间缩短至0.18s,检测速率分别提升了 33.33%和 18.18%,能较好的实现商品的快速识别。
  实验证明,本文在公共数据集和自制商品图像数据集中均取得了较好的效果,验证了算法的有效性和可行性。
其他文献
在大数据时代,特征选择作为一种数据预处理技术,在机器学习领域发挥着越来越重要的作用。目前,大多数特征选择方法主要应用于单标签数据,然而,随着数据维度和标签的不断增加,特征选择已经广泛的应用于多标签数据,并产生了较好的分类效果。传统的一些多标签特征选择算法大多度量特征与整体标签集合的相关性,并选取一组相关性较大的特征子集,然而,多标签数据中的标签间存在着复杂的结构关系,如果仅仅去度量特征与标签间的相
学位
Pawlak提出的粗糙集理论,是一个处理模糊和不精确性问题的数学工具,能对数据进行分析和处理,从中发现隐含的知识;并揭示潜在规律,做出准确决策。但是,Pawlak粗糙集是以等价关系为基础,在很大程度上限制了粗糙集理论的使用范围和处理效果。为了解决这种问题,近年来学者们提出了多种广义粗糙集模型,包含关系粗糙集、模糊粗糙集、变精度粗糙集和覆盖粗糙集等,其中覆盖粗糙集理论已是粗糙集理论的重要组成部分。 
随着互联网、人工智能和云计算等新兴技术的飞速发展,这些领域的数据普遍呈现出高维的特点。同时,这些高维数据又存在特征维数与样本数量不协调、类别分布不均衡的问题。为了能够从这些海量数据中充分挖掘出有价值的信息,特征选择作为一种数据预处理技术,在机器学习领域发挥着越来越重要的作用。面对高维样本数据,目前许多特征选择算法都能够选取出与标签相关度较高、与其它特征冗余度较低的特征。但是,去冗余的过程较为复杂,
学位
蛋白质在生命活动中起着重要作用,了解蛋白质的结构与功能,有助于人类探索生命的运行机制,促进治疗药物的研发。其中,蛋白质与核酸的结合对细胞转录过程具有重要的调控作用,而蛋白质的翻译后修饰广泛存在于细胞翻译过程中。因此,核酸结合蛋白和蛋白质翻译后修饰位点的预测对于了解蛋白质的功能具有重要意义。传统的生物实验方法周期长、成本高,无法满足日益增长的大规模蛋白质数据的预测。基于计算的方法消耗成本更少且简单高
显著性检测是通过模拟人的视觉注意机制,在图像中提取具有显著性的目标区域的过程。作为诸多计算机视觉应用的预处理步骤,显著性检测已广泛应用于多种任务中。本文总结和分析彩色图像显著性检测和高光谱图像显著性检测技术的研究现状,并基于深度学习研究实现了结合对抗学习的彩色图像显著性检测算法和结合自监督学习的高光谱图像显著性检测算法。1.结合双流特征融合及对抗学习的彩色图像显著性检测(SaTSAL)在CGAN主
学位
异质信息网络蕴含丰富的结构信息和语义信息,能够形象、灵活地区分交互系统中对象及关系的差异性。链路预测是图挖掘的基本问题,它根据观察网络中现有的信息估计两个节点之间链路的存在概率,可作为解决数据挖掘中许多任务的基础。现有研究方法多数只关注网络拓扑结构而忽略了节点属性信息,并且用于链路预测的相似性度量方法往往根据元路径考虑节点间的路径相似性。本文根据数据特性提取节点属性信息,结合图核理论,进行异质信息
当代计算机技术与网络迅猛发展,已经深入到各行各业。随着信息时代的到来,人们在享受网络所带来的方便、快捷的同时,也正在被各式各样的网络安全问题威胁和困扰。近几年,网络攻击日渐复杂且具有隐蔽性,致使传统的基于被动防御的网络安全产品和技术难以应对现阶段的网络安全问题,而基于主动防御的网络安全态势感知技术能够更好的解决此类问题。自20世纪末网络安全态势感知技术被提出以来,其被广泛应用于网络安全的各个领域中
学位
脑机接口系统拥有可以绕开外围神经和肌肉组织,在大脑和外部设备间直接建立连接通路的优势,为探索大脑提供了技术支持。基于运动想象任务的脑机接口系统是一种被试者不需要借助外界刺激,仅通过自身想象运动就可以产生脑电信号的自发式脑机接口系统。但是运动想象脑电信号是一种极其弱小的时序信号,具有连续非平稳和低信噪比的特性,且选择信号通道时,部分传统方法采用人工选择的方式,其余方法虽然将全部通道信号输入网络,但信
学位
文本相似性度量作为一项基本任务,对基于文本的分类、聚类及排序等有着广泛影响。现有的文本相似性度量方法往往忽略了非结构化文本数据中的结构化信息及背景信息,仅考虑文本中的单词粒度或短语粒度不能很好地满足文本相似性度量任务的需要。针对上述问题,本文提出基于异质信息网络的文本相似性度量方法(HINSim),将文本相似性度量转化为加权异质信息网络中的节点相似性度量。扩大文本的特征粒度,利用文本的显式语义信息
图像分类是机器学习领域重要的研究课题,广泛地应用于多个领域。同时,日常生活的普遍数字化使得图像数据量急剧增多,使得图像分类的研究变得越来越具有研究价值和现实意义。深度学习的出现极大提升了图像分类的准确率,但其模型训练依赖大量标签数据,且在训练集和测试/应用数据集具有相同统计特征前提下才能达到预期效果。现实应用中带标签数据的获取有时比较困难,或代价很大,迁移学习可以利用少量标注数据或已有过期标注数据
学位