嵌入式卷积神经网络面包智能零售系统设计与实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户:ZHANGLONGQI008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在“互联网+”的浪潮下,人工智能等前沿技术正从学术研究向商业落地迈进,人工智能与实体经济深度融合成为了国家重要战略之一,这也为零售业带来新的机遇。目前众多零售方式采用的是人工识别条码收银结账,会造成收银人工成本过高,结账时间长的问题。本文通过人工智能技术实现机器检测和识别面包并由机器完成收银结账。智能面包识别及结算是本文的关键技术,通过对识别精度、检测速度和使用成本三方面进行研究,设计并实现了嵌入式卷积神经网络的面包智能零售系统,推动零售业的智能化发展。本文将系统架构分为图像采集、面包检测与识别、计价支付几个模块,并重点对面包检测与识别模块的相关算法进行深入研究。通过采集和标注面包模具图像建立面包数据集。在卷积神经网络和目标检测与识别技术的理论基础上分析面包检测与识别的方法。本文先设计了区域候选二阶段面包识别模型,mAP达到0.99验证了面包识别任务的可行性,之后设计端到端单阶段面包识别模型在mAP维持0.99不降的情况下检测速度提高了 4倍,使用jetson TX2作为嵌入式实验平台。为实现系统的商业落地,本文在成本问题上着重考虑,使用较为廉价的搭载安卓系统的C10设备作为嵌入式平台,该设备性能较差且模型容量需限制在10MB左右,面对这一难题,本文引入轻量卷积神经网络并进行算法改进,采用图像处理进行候选区域提取,采用轻量卷积神经网络实现分类识别的方法将模型容量降低近80倍达到3MB,并将mAP维持在0:98。针对图像处理受光照影响的问题本文进一步改进算法,采用网络剪枝后的轻量卷积神经网络结合ncnn框架实现了近似效果并解决了光照问题。最后本文设计安卓app将算法移植并实现了整个嵌入式面包智能零售系统,进过测试,该系统响应速度快,识别准确能够快速投入面包门店进行使用。今后进一步研究工作可以集中在面包数据集的训练优化,缩短训练时间、简化训练流程。
其他文献
目的:评价PPI联合使用SSRI对咽喉反流性疾病(laryngopharyngeal reflux disease,LPRD)合并抑郁(depression)症状患者的疗效是否优于单纯抑酸治疗。方法:对耳鼻喉科门诊可疑LPRD合并抑郁症状的患者采用反流症状指数量表(reflux symptom index,RSI)、反流体征评分量表(reflux finding score)以及抑郁自评量表(se
本文针对多源融合导航定位系统提出完好性监测技术,完好性反映的是系统的稳定性和安全性问题。定位技术发展到现在,面对室内室外各种复杂的定位场景,仅靠某种单一的定位技术已经远不能满足人们的定位需求。目前,将多项定位技术的优劣势进行互补,形成多源融合导航定位技术,已成为定位领域的热门研究主题,同时多源融合导航定位技术也已经广泛应用于各大领域。在多项定位技术中,视觉定位技术因其精度高、成本低、不受信号强弱影
深度卷积神经网络(CNNs)的强大性能是依赖于其庞大的参数量和计算量而产生的,但是这两个特点反而成为了限制卷积神经网络的进一步发展的瓶颈。近年来,越来越多的研究关注如何对卷积神经网络进行压缩与加速。目前的神经网络压缩与加速方法大多采用直观的压缩方案,没有去理解神经网络的内部原理,挖掘冗余性存在的原因和位置。因此,本文提出压缩神经网络前应先分析其内部的工作原理和机制,并基于神经网络的可解释部分来进行
随着人类命运共同体理念逐渐深入人心和“一带一路”倡议的稳步推进,小语种教学在教育对外开放中的作用愈加不可或缺。现实需求催生了中学小语种教育的蓬勃发展和教师队伍的不断壮大,然而在现实中,非师范出身的中学小语种教师入职后往往需要面对身份定位不清晰、以及由此导致的专业发展路径模糊等诸多困境。因此,中学小语种教师身份认同研究对小语种教师的专业发展和小语种教育的优质发展具有重要现实意义。本研究以中学小语种教
芳香化合物是一类重要的化工产品,广泛应用于生产农药、医药、香料和聚合物材料等。为减轻芳香化合物生产对石油资源的依赖,利用生物质基平台化合物制备芳香化合物逐渐成为研究热点,这对于减少环境污染、保护能源安全具有重要意义。本论文以生物质基呋喃衍生物为原料,通过化学催化转化手段,开展呋喃衍生物经Diels-Alder和脱水反应制备可再生芳香化合物的研究。首先,利用SAPO-34分子筛催化2,5-二甲基呋喃
声纹识别属于生物认证技术的一种,相比于其他生物认证技术具有认证方式简单、设备成本低等特点。虽然深度学习在声纹识别问题上取得了巨大的成功,但由于其巨大的存储与计算开销,阻碍了它在资源有限环境中的应用。本文主要研究资源有限下声纹识别的工程化应用问题。首先,针对仅有少量注册人数据可利用的声纹识别问题,本文设计一个一对余(One vs Rest,OvR)神经网络模型用于身份认证。在一个文本相关的自建数据集
随着信息技术行业迅速发展,平板显示产品在人们的日常生活中起到了越发重要的作用,给人类带来了极大的便利,在人机交互领域占据了重要地位。作为当前市场的潮流,小间距LED显示屏具有亮度高、视角广、寿命长、故障率低等特点。作为未来发展的方向OLED显示屏还具有厚度薄、色域广、分辨率高、对比度高、响应时间短、可弯曲等特点,已经逐步开始在产品中应用,受到广泛欢迎。尽管LED显示屏的优点是高稳定性,但在长时间工
随着半导体技术的快速发展,传统晶体管器件的特征尺寸不断微缩到达物理极限,实际发展速度已经落后于摩尔定律的预测速度,这对半导体技术的进一步发展带来了很大的挑战,如尺寸缩小带来的短沟道效应及功耗等问题。为了解决这些问题,各种新材料、新结构不断地被开发研究。无结场效应晶体管和负电容场效应晶体管就是其中的佼佼者。本论文在混合沟道无结场效应晶体管的制备基础上,引入氧化铝铪铁电材料的负电容效应,设计仿真了一种
人工智能技术发展至今,人机交互方式几经迭代,从最早的键盘鼠标方式到后来的触屏手写再到现如今的智能语音交互方式,对人们使用智能科技产品和设备的友好度大大提升。语音合成技术作为智能语音交互过程中的重要一环,它的发展对提高人们体验智能设备的便捷性和舒适度有着举足轻重的作用。其中,个性化语音合成更是亟需攻克的技术难点。传统的语音合成技术采用前端-后端模型的架构,需要分别对前端和后端模型进行详细设计,其中引
为提升高分子膜材料的选择渗透性能、抗污染性能或赋予膜材料新功能,碳纳米材料已广泛应用于高分子膜材料的亲水改性,但鲜有碳纳米材料在高分子膜基质中的迁移行为、分布情况以及固定化策略的相关研究报道。为此,本文首先采用物理共混改性方法,深入研究氧化石墨烯(GO)在聚偏氟乙烯(PVDF)膜基质中分布情况与迁移机制。然后采用膜表面接枝改性方法,研究氨基酸功能化碳量子点(AGQDs)在PVDF膜表面的固定化策略