基于深度学习的货柜商品快速识别算法及应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:catchersun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民经济的高速增长和居民生活水平的不断提高,人们越来越注重消费过程中的体验和感受。以人工智能、大数据和移动支付等先进技术为基础,融合线上线下的“智能+新零售”模式应运而生,正逐渐成为国内零售业新格局竞争的关键。基于计算机视觉的智能售货柜也因此成为行业内的关注热点。为给用户带来方便、快捷的舒适购物体验,智能售货柜必须要考虑商品识别准确度与识别速度的问题,这既是货柜商品智能识别算法研究的重点,也是难点。针对此问题,本文通过对Faster R-CNN、YOLOv3等网络框架进行分析对比,最终选用识别速度与准确度相对平衡、性能更稳定可靠的YOLOv3作为主框架。在该框架下,首先面向不同售货场景设计了不同摆放结构的单门柜和双门柜,并针对这两种不同成像环境分别设计了数据集构建方法和训练策略。为进一步提高识别准确率,通过分析货柜商品目标的特殊性,有针对性地对识别网络加以改进:1)针对目标尺寸普遍较小的特点提出多尺度检测改进策略,通过融合更多的浅层特征信息,增强特征金字塔的表征能力,提升小目标的检测准确率,降低漏检率;2)针对目标尺寸变化不大的特点,通过聚类算法重新统计真实标注框的尺寸,使得先验框比原始预设框更加符合商品目标尺寸,提高网络对目标商品的检测精度;3)针对MSE损失函数对商品目标尺度变化容差较小的问题,采用GIOU损失函数作为目标框坐标回归的损失评价标准,进一步提升检测准确度。为进一步提升智能售货柜商品的识别速度,本文还创新性地提出了基于马赛克图像的商品快速识别模型,并将其整合到改进的YOLOv3框架中。众所周知,当前目标识别算法大都是利用全彩图像进行识别分类的,而全彩图像是从相机拍摄得到的Bayer格式的原始图片解马赛克得到的。为使图像具有更好的视觉效果,通常还会经过插值、去噪、增强等处理过程,这些操作都会对马赛克图像中原始信息造成一定损失,并且会加入过多的冗余信息。本文算法的创新之处在于跳过解马赛克的过程,直接将原始图像送入深度神经网络中,进行端到端的识别分类,这样不仅可以避免复杂的图像复原算法,减少计算负担,而且能够更快地获取图像分类识别信息。基于上述原因,本文在智能售货柜场景下对采集到的马赛克图像数据集,设计了基于空洞卷积、相位卷积和子像素卷积的预处理网络,并通过对比实验验证了该策略比传统的全彩色图像目标识别算法拥有更高的检测精度和更快的检测速度。此外,本文从系统稳定性可靠性出发,基于提出的网络架构,设计并实现了智能售货柜整机系统,实现了扫码开门、自由选货、关门自动结算的功能。目前已经上线测试,运行状况良好,较大地提升了用户购物体验。疫情期间,智能售货柜的投入使用,可有效减少居民出行和流动,减少人际接触,从而降低传播风险,为疫情防控工作助力。
其他文献
机器人技术与机器人产业已经成为社会经济发展的重要支柱。七自由度机械臂由于其灵活、重量轻以及适用场合多样等特点,是机器人未来发展的重要方向。本文以具有球腕结构的七自由度机械臂为对象,研究了七自由度机械臂的运动学解析解、动力学解析解以及控制方法,并通过仿真验证了这些算法的准确性与可行性。研究取得的主要内容有:(1)对七自由度机械臂的构型进行了分类和比较,从中选取了具有球腕关节的构型作为研究对象。通过建
天线作为无线通信系统的组成部分,一直承担着收发电磁波的重要责任。现如今,随着通信需求的不断提高,天线阵的出现和设计也越来越精细复杂。对于庞大且复杂的天线阵结构,优化设计研究所耗费的计算资源如计算时间、内存消耗等也随之增大。本文旨在利用机器学习能够拟合复杂非线性函数的同时计算耗时还低的优势,将天线阵优化设计与机器学习相结合,降低传统天线优化设计的成本。本文的主要研究工作为将机器学习方法应用于天线阵优
在当今各个现代化行业中,应变监测技术都有着广泛的应用需求,如结构健康监测领域需要应变监测技术确保结构在可允许的范围内使用。然而目前的应变传感器多数采用有线有源的技术方案,难以适用于封闭空间、高温高压以及机械动力旋转部件等恶劣测量场合,对于上述场合的应变测量,只能使用无线无源应变传感器。因此关于无线无源应变传感器的研究很有意义。常见的电容式无线无源应变传感器结构复杂、高工艺要求等不足限制了其使用场合
车辆、舰船、飞行器等运输载体在工作过程中受外界环境影响较大,将不可避免产生颠簸、震荡等现象,从而导致运输载体上的导航、侦察和稳瞄等设备无法正常工作。稳定平台能够通过实时检测并主动补偿运输载体的位姿变化,实现隔离扰动,从而保证安装于载体的设备在外部干扰作用下具有稳定的工作环境。本文研究的2-UPS/U并联机构是一种典型的少自由度并联机构,能够绕空间定点实现两个方向的自由转动,具有刚度大、承载力强和控
近年来软体机器人逐渐成为了机器人领域研究的热点。软体执行器作为软体机器人的重要组成单元,具有柔性好和适应性强等优点,被广泛应用于物体抓持和医疗服务等领域。然而,由于软体执行器具有材料非线性和几何非线性,其运动学建模一般是结合实验得出含有大量经验参数的数值化公式,难以进行参数优化分析。本文为了建立一种描述气动软体执行器弯曲变形的数学模型,首先利用简化的Yeoh模型建立了其主动弯曲变形模型,然后基于链
机器博弈是检验人工智能发展水平的一个重要标准,其研究成果能够解决许多现实问题。根据参与者能否完全掌握博弈状态,机器博弈分为完备信息机器博弈和非完备信息机器博弈。多人非完备信息机器博弈问题广泛存在于现实世界中:小到人与人之间的牌类博弈,大到国与国之间的军事博弈。因此,研究多人非完备信息机器博弈具有十分重要的意义。近年来,随着深度神经网络的发展,研究人员将神经网络应用在多人非完备信息机器博弈上,并取得
随着深度学习技术的应用和发展,其安全隐患逐渐暴露出来。神经网络已被证明容易受到对抗性攻击,通过向样本添加微小的扰动能够使得模型输出错误的结果。这一安全威胁逐渐渗透到计算机视觉、语音识别、自然语言处理等各个领域。当前针对对抗样本的研究还存在诸多的问题:首先,多数关于对抗样本的研究集中于样本依赖的对抗扰动方法,这样的方法需要为每个样本生成特定的对抗性扰动,攻击的实现依赖于样本,效率较低。最近的研究表明
在军事作战中,空中作战能力一直都是军事实力的一种重要体现方式。伴随着红外技术日新月异的发展,红外制导导弹已经成为了战争中的主流作战武器,而红外诱饵弹在红外作战对抗中因为其干扰效果明显,作战性能显著,使得红外制导武器对目标无法实现精准定位与毁伤打击,故该军事装备成为干扰武器的首选,因此对于飞行器和诱饵弹的辐射特征以及运动特征对于诱饵弹鉴别方面有着极为重要的意义。本文正是以此背景为出发点,对红外机动目
随着人工智能理论和技术的飞速进步,各界对人工智能的关注度持续提升。同时,软件技术也在驱动着包括仪器仪表在内的各领域的进步,软件系统已成为大多数产品不可或缺的一部分。但软件系统功能的逐渐增多,引发了软件使用难、使用率低等问题,因此,将人工智能技术融合在软件使用帮助过程中不仅提升软件帮助水平,而且助力行业快速发展。本文在分析软件帮助系统、人机对话系统的研究现状之后,提出了一种基于软件实景的省略歧义处理
超声侧壁仪用于大型建筑建造地基时钻孔的测量工作。钻孔的质量会对浇注混凝土后成桩的质量产生很大的影响,从而影响整个建筑结构的稳定性。因此超声侧壁仪的测量精度在大型建筑的建造过程中起着非常重要的作用,也对系统中使用的嵌入式实时操作系统的性能提出了更高的要求。随着5G技术与物联网的不断普及,嵌入式系统也逐渐应用到生活中的各个方面。实时操作系统由于其具有实时性、高可靠度、专业化强、易于裁剪和移植等特点,在