【摘 要】
:
随着我国工业生产水平的提高,工业生产自动化已经成为现代制造领域中最重要的技术之一,实现自动化是企业生产效率得以显著提升的一大途径。现如今大部分工厂对于工件的管理依然采用人工识别编号字符,再将信息录入系统的方式。传统的光学字符识别技术(OCR)主要应用于文档一类背景简单、文字清晰的字符识别上,虽然技术相对成熟,但对工件编号字符的识别普遍性能较差。近年来,深度学习技术已经在计算机视觉方向取得了显著的成
论文部分内容阅读
随着我国工业生产水平的提高,工业生产自动化已经成为现代制造领域中最重要的技术之一,实现自动化是企业生产效率得以显著提升的一大途径。现如今大部分工厂对于工件的管理依然采用人工识别编号字符,再将信息录入系统的方式。传统的光学字符识别技术(OCR)主要应用于文档一类背景简单、文字清晰的字符识别上,虽然技术相对成熟,但对工件编号字符的识别普遍性能较差。近年来,深度学习技术已经在计算机视觉方向取得了显著的成果。通过结合深度学习技术,实现工业场景下的工件编号图像的识别,对于我国的工业自动化发展将会起到推进作用。本文主要研究内容包括工件编号编号检测和识别,通过对文本检测网络的速度优化、增强文本识别网络的字符特征,解决了工业场景下字符的误检、粘连断裂等导致识别失败的问题。针对工业环境下工件编号存在手写字迹污染易造成错误定位问题,本文确定了基于语义分割的文本检测网络PSENet作为实验的基准方法。为了适用于工件出入库系统的实时使用需求,为PSENet设计轻量化特征提取网络,运用深度可分离思想进行了上采样特征增强;引入ASPP模块解决编号区域在图像中占比小的问题。针对工厂采集图像自建文本检测数据集数据量少的问题,采用迁移学习的方法减少对训练数据依赖。实验表明本文改进的PSENet在自建数据集上有98.5%的检测准确率,较原网络F-measure指标提升了0.4%,同时检测速度每张达到79ms。字符识别方面,针对工业场景下字符断裂、粘连难以分割的特点,本文选用无需分割的CRNN深度学习方法作为工件编号字符识别算法。使用Dense Net改进特征提取网络以提高字符特征的表达能力,采用双向LSTM根据字符之间的相互关联对字符序列进行预测,针对编号不定长问题采用CTC损失函数作为LSTM的拓展连接。在自建工业字符识别数据集上,采用不同数据增强的方式,使识别模型更具鲁棒性。实验结果表明改进后的CRNN网络在数据集上准确率达到92.9%,优于其他特征提取网络算法。本文通过工业场景下的实验,提高了编号检测以及识别效果。此外,在微信开发者平台上基于B/S架构开发,采用MINA框架和Flask框架完成前后端通信,采用My SQL数据库进行数据存储,实现了完整的工件出入库系统。
其他文献
随着当代人工智能技术应用的水平不断得到进步,人脸情绪识别算法作为一种生物识别技术,逐渐在当今计算机视觉系统和智能识别处理等各领域得到人们了更加广泛的关注。由于安装成本和灵活性限制等种种原因,目前的现实生活应用中的大部分视觉系统为单目相机,其他应用也因此受限。例如单目相机等二维视觉系统可以获取和生成大量丰富的平面图像资源,其具有数据获取的便捷性、存储空间小等优势,但使用二维人脸图像很易导致受到光照不
机器人末端负载的质量及质心位置获取与主动柔顺控制是机器人完成高精度任务和保证人机交互过程中环境与本体安全的基础。目前,随着机器人应用的多元化,机器人末端负载的质量及质心位置如何获取、如何保证通过拖动示教展现主动柔顺特性时系统的稳定性以及柔顺性,具有十分迫切的研究需求和深远的研究意义。针对以上问题论文从两方面进行研究,一方面,针对末端负载质量及质心位置获取问题,论文提出基于静态示教位姿的末端负载辨识
近年来,随着现代化和工业化的发展,汽车的需求量大幅增加,这导致能源危机,空气污染的情况日趋严重。为了解决这一状况,全球各国正大力开发新能源。在众多能源中,燃料电池凭借着零排放、高效率、清洁等优点脱颖而出。但是在实际应用中,燃料电池仍然存在不足,首先燃料电池无法单独作为能源,因为其动态响应能力较差,无法面对各种突发情况。其次在评价汽车性能的时候,单一的指标是无法决定汽车性能的优劣。而汽车的经济性和动
随着人口老龄化问题日益严重,脑卒中等疾病患者数量不断增加,导致行走能力障碍的患者人数也不断增加,同时我国现阶段的医疗资源比较紧缺,对于行走能力障碍患者的康复训练资源不足。为了缓解紧张的医疗资源,同时减轻患者家属及社会的经济负担,对于康复训练机器人的研究受到了研究者们的关注。目前康复训练机器人跟踪控制的众多研究成果中大多没有考虑康复训练机器人暂态过程的运动性能,如果康复机器人的初始误差较大,进而康复
由于世界能源的短缺、温室效应的产生以及环境不断地受到污染,太阳能在当今时代的发展已经成为不可或缺的一种新型的清洁能源。随着近年来国内外大型光伏电站的增多,一些光伏电站出现了大面积发电量减少的现象,业界人员称之为电势诱导衰减(Potential Induced Degradation,简称PID),这种现象导致光伏电站的收益受到大规模影响。由于光伏电站中从电池板到逆变器的直流母线线路多、分布广且大部
手持式触摸设备是人们日常生活的必需品,在使用过程中,用户更倾向于单手持握触摸设备,手持式触摸设备的交互任务可分为点击和滑动任务,点击常用作目标选择任务,而滑动任务常出现在浏览大篇幅内容的长浏览页面中。然而在单手持握的方式下面临着诸多难题,以至于在某些场景中不得已切换为一手持握一手操作或双手操作的方式,由于持握姿态的转变,用户需要将精力全身心的投入到与手持式触摸设备的交互中,而忽略了其自身的安全。为
从多帧二维声纳图像恢复出三维信息是水声三维重建的核心问题,而用于水声三维重建的声纳设备众多,不同的声纳器件有着不同的物理特性,声纳设备的差异化也提出了对重建算法的特定需求。本文主要针对宽孔径前视声纳和侧扫声纳两种声纳设备开展三维重建算法研究。论文取得的成果如下:(1)首先指出了一种从前视声纳多帧图像进行三维重建的方法。阐述了声纳图像方程及采用盲解卷积算法的含义,讨论了实际解算过程中需要考虑约束的具
随着工业界的蓬勃发展,涌现出很多大型现代化设备,这些大型设备可以提高工业的生产效率,促进社会发展,可以说人类的发展越来越离不开大型先进设备的支持。但是越是功能强大的设备,其机器结构越复杂且造价昂贵,大型现代化设备的使用时间越久,所暴露出的故障数量就越多,种类越广,复杂且多变。一旦设备出现自身无法解决的问题,唯一办法就是要找专业的维修专家来进行设备维修,推荐哪位维修专家来对该设备所发生的故障精准高效
多视角(MVS)深度估计利用多个视角的相机参数和图像序列获取每个视角的深度图,是从图像恢复三维空间结构的方法之一,应用于文物修复、三维打印等专业领域中。基于深度学习的MVS深度估计使用图形处理器构建卷积神经网络,对复杂环境的鲁棒性较高。基于深度学习的MVS深度估计在特征提取部分主要以二维卷积结构为主,提取特征时受二维卷积结构影响较大,可以改进特征提取结构提高精度。此外,由于基于深度学习的方法中间输
用于组织亚型划分和异常识别的细胞核分割既是细胞内部进行特征提取和分类的关键起点,也是建立细胞分布模型的基础,所以在病理图像中对细胞核的准确定位是进一步分析的重要内容。但由于细胞核具有重叠、边界不清等数据特点,现有的方法并不能很好地解决这些问题。因此,本文以细胞核病理图像为主要研究对象,利用深度学习的技术进行细胞核分割的研究。本文的主要研究内容如下:在细胞核病理图像预处理阶段,针对图像存在颜色不一致