复杂背景下的工业字符分割与识别研究

来源 :广西师范大学 | 被引量 : 2次 | 上传用户：ttgxa

【摘要】

：

光学字符识别(Optical Character Recognition,OCR)识别技术始于上世纪六十年代,从对简单的印刷文本发展到现在各种复杂场景中的字符识别,其受到了越来越多的关注。随着工业

【作者】

：

吴慧莹

【出处】

：

广西师范大学

【发表日期】

：

2020年01期

【关键词】

：

工业字符字符分割文本检测卷积循环神经网络注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

光学字符识别(Optical Character Recognition,OCR)识别技术始于上世纪六十年代,从对简单的印刷文本发展到现在各种复杂场景中的字符识别,其受到了越来越多的关注。随着工业进入4.0时代,工业生产升级为高度数字化、智能化的生产模式,信息化技术将实体与网络相结合为工业生产注入了新的活力,自动化字符识别成为工业生产中研究的热点之一。工业生产要求生产线上的产品信息能够被快速检测和识别,但过程中存在各种因素干扰,例如生产环境的噪声,光照条件以及工业字符的多样性等,都给字符识别带来了一定的难度。针对目前工业字符识别所面临的难点,本文将基于传统字符识别流程和基于深度学习字符识别流程分别对单个字符和整体字符序列识别进行研究,具体工作包括以下几个方面:(1)在传统字符识别流程中提出基于连通域与几何特征的字符分割方法,解决结构不连续或粘连字符的分割问题。该流程在字符分割之前采用Blob分析去除图像中的干扰信息,获取字符区域,并通过椭圆拟合与仿射变换对倾斜字符进行校正;使用基于连通域与几何特征的分割方法时,对于不连续字符先进行形态学填充与连通性分析,然后根据字符连通域得到第一次粗分割结果,第二次分割在粗分割基础上寻找每个连通域的最小外接矩形,以初始字符的宽高特征对最小外接矩形进行等间距矩形分割,从而获得单个字符;最后使用该方法对本文所采集的点阵字符图像进行分割并采用K近邻、支持向量机和多层前馈神经网络验证分割字符的有效性。实验结果表明,基于连通域与几何特征的字符分割方法与传统方法相比能更有效地分割不连续或粘连的字符。(2)提出基于CRNN(Convolutional Recurrent Neural Network)与CTPN(Connectionist Text Proposal Network)及注意力机制组合的端到端字符识别网络,对工业字符实现无分割以及多类字符识别。工业字符识别与一般文档识别难点不同之处在于其图像背景复杂、字符类型多样、排版不固定并且噪声干扰多,传统方法难以实现字符定位与分割,而本部分工作以目前流行的自然场景文本识别网络CRNN为基础加入CTPN网络,可在复杂的图像中直接检测出感兴趣的文本区域,同时CRNN通过引入注意力机制对字符序列特征进行权重分配,提高网络对长序列文本图像中关键信息的注意度,在字符序列过长和字符背景及噪声干扰时,依然能够保持稳定的识别。实验结果表明,基于CTPN与CRNN及注意力机制的组合与单一的CRNN网络相比,在工业字符的检测与识别中有更好的效果。(3)针对本文所用到的传统字符识别流程和基于深度学习字符识别流程分别设计了基于QT的点阵字符识别系统和基于Flask Web的字符识别系统。通过界面化的操作,使实验结果更加直观,更有利于对两种方法进行比较与分析。

其他文献

最优平均汉明相关跳频序列集设计与分析

跳频通信最早始于军事无线电通信,具有隐蔽性强,抗干扰,抗衰落能力强等诸多优势。随着技术的推陈出新,跳频通信的应用更加广泛。跳频通信系统是扩展频谱通信方式的一种,经由

学位

跳频序列集最大汉明相关函数平均汉明相关函数Peng-Fan界分圆理论

基于局部像素预测和差值的加密图像可逆信息隐藏算法研究

随着计算机技术和5G技术的迅猛发展,网络传输能力得到迅速提升,为信息的传播、处理和应用等提供了便利。与此同时,信息数据通过网络传输容易被截取,存储的信息容易受到攻击,

学位

可逆信息隐藏差值压缩局部像素预测差值图像直方图平移

对地火控系统仿真测试平台的架构与实现

21世纪初,我国从俄罗斯进口了一批先进歼击机,该批次的歼击机装备了对地火控系统。随着飞机使用年限增加,对地火控系统产品故障率也随之上升。由于俄方未提供系统级的检测设

学位

对地火控系统仿真测试平台仿真测试软件性能测试

短波自组织令牌环组网研究

短波自组织网络具有通信范围广和抗毁能力强等特点,在抢险救灾等场景广泛应用。短波自组织令牌环协议是无线令牌环协议发展而来适用于短波通信的媒体访问控制协议,短波令牌环

学位

自组织网络短波网令牌环传输顺序抗干扰

基于概率模型的人体运动学习方法研究

近年来,随着计算机视觉技术和深度相机的快速发展,基于人体姿势等视觉信息的可靠分割并进行人体姿势识别的研究越来越深入。人体姿态识别使得机器人可以通过结合环境、目的判

学位

GMM-HMM实时识别骨骼姿势特征关节角度特征

Ti金属原子间势的构建

随着科技的进步,金属及其化合物已经成为高温材料的首选,从而广泛地被人们使用,其中,由于Ti金属及其合金可以成为很好的耐高温材料,所以受到广泛地关注。近几年,越来越多的人

学位

Ti金属嵌入原子势空位形成能空位结合能结构稳定性

基于WI-FI/PDR融合的室内定位技术研究

一种被广泛应用的高科技技术:定位技术,在商业、交通和军事方面都有着巨大的作用,发展潜力是全社会有目共睹的。随着各行各业对个体位置信息精确度需求的提高,以及可携带智能

学位

WI-FI指纹定位PDR定位融合定位算法卡尔曼滤波

电静液系统位置及力控制特性分析与补偿方法

外骨骼机器人能够在保证人体各种动作与机械之间相互协调情况下,大幅提升人体力量,实现长途行军和负重搬运,完成侦查、作战、运输等任务,也可以协助躯体力量不足者进行运动和

学位

液压外骨骼机器人液压驱动单元电静液系统摩擦补偿谐波抑制

脸书对南格哈尔大学新闻与公共关系学院学生学业成绩影响研究

随着社交媒体(特别是Facebook)的迅速兴起和日益普及,学生们开始在日常社交和学术生活中加入并使用它。实证研究表明,如今Facebook被认为是年轻一代和大学生中最受欢迎的在线

学位

社交媒体脸书学业成绩南加哈尔大学学生

基于规则模型的广东省土壤重金属源识别及影响因子解析

土壤重金属的危害性众所周知,影响土壤中重金属含量的因子极其复杂。界定其来源并识别与解析土壤重金属影响因子,对土壤重金属模拟、预测预警,控制土壤重金属污染及指导相关

学位

Rule-Based模型土壤重金属Cubist影响因子广东省

复杂背景下的工业字符分割与识别研究

与本文相关的学术论文