【摘 要】
:
近几年来,随着人工智能的快速兴起,无人零售逐渐发展了起来,其中智能货柜成为各大电商的密切关注和各路资本的追捧的一个方向。随着深度学习在机器视觉领域的发展,智能货柜不断改进,从非视觉的传统方案转变为基于深度神经网络的视觉解决方案。本文基于智能货柜的视觉方案对商品的识别进行研究,主要的工作内容如下:(1)针对智能货柜标准数据集缺失的问题,根据场景特点分别建立静态场景数据集FSD20和动态场景数据集FD
论文部分内容阅读
近几年来,随着人工智能的快速兴起,无人零售逐渐发展了起来,其中智能货柜成为各大电商的密切关注和各路资本的追捧的一个方向。随着深度学习在机器视觉领域的发展,智能货柜不断改进,从非视觉的传统方案转变为基于深度神经网络的视觉解决方案。本文基于智能货柜的视觉方案对商品的识别进行研究,主要的工作内容如下:(1)针对智能货柜标准数据集缺失的问题,根据场景特点分别建立静态场景数据集FSD20和动态场景数据集FDD20。其中,静态数据集FSD20包含88类商品,超过8300多张图片;动态场景数据集FDD20共有15个拿取商品的视频序列,包含10类商品。(2)针对静态场景,本文提出基于检测的静态方案。为了降低静态方案在嵌入式设备上检测模型的计算量,提高模型的推理速度,本文使用瓶颈残差块对Center Net网络的残差块进行改进,并提出Center Net-D(Center Net based on Depthwise Separable Convolution)模型结构。在Center Net-D基础上,本文进一步构造Center Net-DD(Center Net-D based on Dilated Convolution)模型,使用空洞卷积在不增加参数数量的情况下增大网络感受野,提高对大目标的检测准确率。在静态态场景数据FSD20上的实验表明,Center Net-DD算法将参数数量由15.7M降到3.5M,浮点运算次数由6.14G降到0.66G,同时正确率有了一定提升。(3)针对静态方案下的所采用的摄像头数目较多、空间利用率低、对摆放位置有限制等不足,探索性的提出基于多目标跟踪的动态方案并进行了实现。本文设计了一个轻量级的网络Bottle Net6,该网络在多目标跟踪里用来快速的提取商品的深度表观特征。在动态方案中,基于改进的Center Net-DD检测算法添加运动特征和Bottle Net6提取的深度特征,并将商品识别和基于Kalman滤波商品跟踪进行结合,进行实验对比发现,添加运动特征和深度特征能够有效减少商品的漏检和误识的情况,提高了智能货柜商品识别的稳定性。综上所述,本文对智能货柜的商品识别问题,首先提出并实现了基于检测的静态方案,并对静态方案的不足,提出并实现了基于多目标跟踪的动态方案,取得了更好的实际效果,有较强的实际应用价值。
其他文献
平面设计已经深入我们的生活,个人网站、博客、PowerPoint等的广泛应用其实使得平面设计不再是设计师的专职工作,而是没有受过设计训练的普通人也会接触到的。然而,由于很多用户并不具备必要的设计知识和审美能力,造成了设计质量的良莠不齐。如何为新手用户的平面设计活动提供帮助,降低设计门槛,提高设计质量显得格外重要。版式设计是网页等平面设计中的重要领域,现有的版式自动生成或优化方法,大多是生硬地套用传
近年来,在实施创新驱动发展战略的背景下,国内的高新技术企业研发投资(Research and development,简称R&D)水平呈高速增长的态势,但仍远低于发达国家水平,其中一个重要的原因是融资受限。为了缓解企业融资困难,提高R&D活动水平,国资委在2006年底颁布的《中央企业负责人经营业绩考核暂行办法》中鼓励中央企业使用经济增加值(Economic Value Added,
近年来,物联网(Io T)技术不断发展,已经广泛应用于交通管理、物流运输、图书管理和医疗环境等领域,在给人们带来高效和便捷的同时,其面临的安全和隐私问题也不容小觑。射频识别(RFID)技术作为物联网感知层的核心技术之一,依靠射频信号完成特定对象的自动识别,可以迅速地进行对象位置追踪和数据交换。为了实现RFID的身份认证等功能,确保敏感数据的隐私性,学者们给予了高度的重视。但是由于RFID系统环境的
日志记录了系统事件,系统运维人员可以通过日志来了解和优化系统行为。通过模板挖掘生成日志事件、并实现日志分类的方式近年来被广泛研究,其中基于聚类进行日志模板挖掘的方法成为主流。目前大多数聚类方式都依赖于人工预先设定聚类数目k,在真实的生产工作中是很难实现且极不方便的;而不需预先设定k值的方法大多聚类规则较简单,效果不够理想。针对以上问题,本文设计并实现了基于模板挖掘的日志分类方法。方法分为两个过程。
一、急性胰腺炎大鼠中E-钙粘蛋白的检测目的 探讨E-钙粘蛋白在急性胰腺炎中的表达及对其严重性的诊断价值。方法 24只雄性SD大鼠随机分为对照组、MAP组和SAP组。通过腹腔注射L-精氨酸造模,建模24h后测定血清中淀粉酶活性、WBC、CRP、PCT及E-cadherin表达变化,胰腺组织进行病理组织学观察,Western印迹检测胰腺组织E-cadherin的蛋白表达。结果 MAP组和SAP组胰腺病
在风力发电系统中,双馈风力发电机(Doubly Fed Induction Generator,DFIG)具有有功功率和无功功率可独立调节的特点、进行最大风能追踪的变速恒频发电运行能力、以及励磁变流器容量远小于风力发电系统容量的优势,成为当前风能开发利用的主流机型。我国风电开发采取高度集中的模式,风电场大多位于电网末端,在长距离输电线路中存在各种稳态、暂态、对称、不对称的电路故障和各种电力谐波,使
现今的社会已经进入到了信息化时代,随之而来的是以网络媒体为代表的新兴媒体形态的出现,人们的生活已经与网络深深结合,网络已经渗透到了生活的方方面面。大学生是新时期中国发展的中坚力量,是建设中国特色社会主义伟大事业的接班人,他们作为时代的先锋和先进理念的接受者,其价值观的形成必然受到网络媒体的巨大影响。网络媒体有着与传统媒体相比更加先进的媒介传播模式和互动能力,大学生作为互联网用户的主流部分,其价值观
光电化学(PEC)水分解是指将具有光活性的半导体材料作为光电极,在外加电压的辅助下,利用太阳光将水分解成氢气和氧气的过程。因其具有清洁、可再生的特点,PEC水分解被认为是绿色产氢的一大重要途径。为了提高PEC水分解的效率,人们致力于寻找更加合适的光电极材料或将现有的材料进行改性优化。氧化钨(WO3)是制作光阳极的典型材料。但是较宽的带隙和表面缓慢的析氧动力学限制了 WO3光阳极的PEC水分解效率。
在电力电子技术不断发展的背景下,电力电子器件在电力系统、铁路系统、工业领域、日常生活等各个领域得到了愈加广泛的应用。在提高系统整体效率的同时也不可避免的带来种种问题,其中很重要的一个就是谐波污染。针对谐波污染问题,前后有很多研究人员提出了不少谐波治理方案,其中APF(Active Power Filter,有源电力滤波器)由于其能实时、准确地补偿谐波电流而得到了广泛应用。在实现谐波准确地动态补偿过
随着国家事业单位改革进程的推进,云煤X队在市场竞争中由于项目优先级决策方式的落后导致发展受到制约:一方面是战略发展目标难以实现,另一方面是造成内部资源消耗增加。云煤X队如何在战略目标导向以及资金、设备和人力资源等条件的约束下实现项目市场竞争力的提升,项目组合优先级评价问题已成为云煤X队必须解决的迫切问题。本文以美国项目管理协会制定的项目评价指标标准为模型原型,结合云煤X队地质勘查组织的特殊性,从云