基于深度学习的票据文本检测识别研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:ding7881
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本区域检测过程中,多次的卷积和下采样会使得原始图像中小文本区域在后续特征图中持续变小,甚至丢失,从而导致小文本区域检测的精度较低。另一方面,为了实现对单个字符的检测,在训练集制作时,需要对每个字符进行标注,这导致训练集的制作非常繁琐,特别当票据类数据图像中存在大量字符时,对每一个字符进行标注,使得训练集制作成本非常高。在文字识别过程中,典型的基于深度神经网络的OCR模型以自然场景中的文字识别为研究对象,由于自然场景中的文字形态各异、角度多样,为了获得好的识别精度,识别模型复杂,参数量大,从而导致模型训练困难、识别速度慢等问题。基于此,本文针对上述3个问题开展研究工作:(1)为了解决文本检测模型对较小文本区域易漏检的问题,本文提出了基于字符的文本检测模型LW-Char Net(Light Wave Character Network)。LW-Char Net模型优化了CRAFT(Character Region Awareness For Text detection)模型的网络结构,将未经下采样的特征图与下采样一次和多次的特征图相融合,并增加上采样的层数,从而使得小区域文本特征更加明显,提高了对小区域文本的识别精度。将LW-Char Net模型与CRAFT等5个文本检测基线模型进行了对比,通过对比精度、召回率以及Hmean值,验证了LW-Char Net的有效性。(2)为了解决基于字符的文本检测模型标注成本高的问题,本文给出了对应LW-Char Net的数据标注解决方法。该方法基于迁移学习的思想,采用已有的字符级标注数据集来训练LW-Char Net模型,再利用收敛后的模型来检测票据文本的字符区域,获得字符区域的预标注结果,最后,结合人工来修正预标注结果,从而极大降低了标注成本。(3)针对文本识别模型相对于票据文本识别过于复杂,导致模型训练难度大以及识别速度慢的问题,本文提出了文本识别模型CBF-Net(Convolutional Bidrectional-LSTM Fully-connected Network)。CBF-Net简化了CRNN(Conv olutional Recurrent Neural Network)模型的网络结构。CBF-Net由单层的Bidrec tional-LSTM(Bidrectional Long Short Term Memory Network)以及全连接组成的RNN(Recurrent Neural Network)模块构成,模型参数较之原模型有所减少,从而有助于简化模型训练,提高识别速度。通过实验与CRNN、CNN(Convolutional Neural Network)两个基线模型进行了准确率和识别速度方面的对比,最终发现CBF-Net在票据数据集的识别方面有着较高的准确率,同时有着较快的识别速度。
其他文献
杜仲中含有丰富的化学成分,包括环烯醚萜类、木脂素类、黄酮类、苯丙素类、多糖类等,在降血糖、降血压、降血脂、抗骨质疏松、抗氧化、免疫调节、抗炎、抑菌等方便具有显著功效。综述了近些年来对杜仲的化学成分、药理作用及应用的研究成果,以期对杜仲的进一步开发利用提供参考。
数学新课标指出:"综合与实践是一类以问题为载体、以学生自主参与为主的学习活动。在学习活动中,学生将综合运用数与代数、图形与几何、统计与概率等知识和方法解决问题。综合与实践的教学活动应当保证每学期至少一次,可以在课堂上完成,也可以课内外相结合。提倡把这种教学形式体现在日常教学活动中。"综合与实践活动是以实践为主要形式,以教师为主导、学生为主体操作的一种学习活动,选择的问题都是综合的、富有生活化
期刊
随着油气田勘探以及开发不断深入,其工作中产生了海量数据,不论是对数据进行采集、存储,还是处理分析,都存在越来越多的困难。而大数据和人工智能的产生,为油气田的智能化发展提供了动力,极大地推动了油气田开发的智慧化发展。基于此,文章首先分析了油气田开发中大数据与人工智能应用的重要价值,之后对当前油气田开发中大数据的应用以及人工智能的应用情况分别进行了介绍。
小学生在学习数学的过程中,要懂得数学的科学性、严谨性、实用性,由此数学学习思维才能变得更加活跃,同时也能通过大量的实践任务,夯实个人的数学基础,加深个人对于数学的认识。教师为此要帮助学生构建起一个更加良好的数学学习平台,协同学生完成好数学实践任务,帮助学生深入钻研数学课题,又能让学生的数学核心素养得到更大的提高。教师为达成教学目标,应适当转换教学思维。
油气田勘探开发行业发展至今,涉及的钻井、测录井、试油等各项技术已较为成熟,可突破空间越来越小。通过现代信息技术与油气田勘探技术的跨界融合,可为油气勘探带来新的强劲发展动力,从而实现对传统勘探技术的颠覆性创新,引领油气田勘探行业从数字化时代迈向智能化时代。在分析勘探工程数字化转型的发展基础及必要性的基础上,提出了转型的方向:全景油气田勘探物联网、智慧钻探数据生态治理、智能钻井设计、智能钻完井作业、智
"综合与实践"要体现综合性和实践性,旨在让学生从所熟悉的现实生活中发现、选择和确定问题,经历全程参与学习实践,并解决现实生活中具有挑战性和综合性的问题,从而提升学生的数学学科核心素养。
从差压式流量计的原理出发,探讨了差压变送器对差压式流量计测量准确度的影响情况与特性,并结合其特征提出了优化的差压变送器校准方法,使得差压式流量计的测量结果更为准确可靠。
2020年12月7日至8日,由工业和信息化部、国家国防科技工业局、中国工程院指导,国家新材料产业发展专家咨询委员会、中国和平利用军工技术协会等单位主办的第五届军民两用新材料大会暨2020中国特种材料及制品展览会在山东青岛召开。粉末冶金产业技术创新战略联盟名誉理事长、国家新材料产业发展专家咨询委员会主任、中国工程院原副院长干勇院士,粉末冶金产业技术创新战略联盟理事长、中国钢研科技集团有限公司党
期刊
汽车底盘构造是车辆工程专业的必修课程,是从事汽车设计、制造与研发人员必备的基础知识。本文根据汽车底盘构造知识点教学特征,分析传统教学方法中存在的一些问题;针对现存问题,探索虚实结合的汽车底盘构造智慧教学方法,包括利用网络优质视频资源实现翻转课堂自主学习、设计虚拟零部件拆装环境互动式学习、以及现场实物讲解答疑式学习、在教学实践中巧妙融入思政元素、根据汽车底盘构造特点改革考核办法等,解决了汽车底盘构造