增值税发票内容自动识别系统研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:mc_2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
增值税发票在社会经济活动中具有极其重要的意义和作用,特别是发票上有很多重要的信息需要存储在计算机上。为了降低人工录入的成本,本文设计了一款基于卷积神经网络的增值税发票自动识别系统。该系统是基于卷积神经网络的自动化系统,它包含了两个作用不同的卷积神经网络,一个用以检测目标区域,另外一个用以获得目标区域的具体字符信息。系统采用扫描仪对多张发票进行图像采集,系统主要由输入、预处理、切割、识别、定位、记录6个模块组成。增值税发票识别系统的关键模块是定位和识别,这两个模块的精度与速度决定了整个系统的好坏。传统的定位方法不能很好地平衡检测精度和时延性的问题,为了解决这一问题,在系统的定位模块中引入YOLOv3检测算法对目标发票目标区域进行定位,使目标检测能更好地提升检测精度的同时又不会产生过高的系统延迟。在字符识别方面,模板匹配具有自身的局限性,若原图像中的匹配目标发生旋转或大小变换,模板匹配的自身局限性决定了该算法在多尺度或图形略微畸变的情况下不能实现精确的匹配。在发票系统的识别模块中,为了解决模板匹配的局限性,采用了Inception卷积神经网络对字符进行识别,使图像能在一般情况下都能完成精确的识别。本文主要内容和成果如下:1.图像预处理模块改进本文在增值税发票内容自动识别系统的图像预处理模块中,针对发票倒置判断容易发生误判的问题,对发票倒转的判断条件进行了改进;在增值税发票内容自动识别系统中的切割模块中,针对人工设置阈值二值化分离前景背景不准确的问题,采用了大津算法对图片进行自适应阈值计算,为了解决局部有污点或者亮度不均的发票对象,把图像分成若干块采用大津算法。2.基于卷积神经网络的目标区域的定位由于新兴的深度学习卷积神经网络技术在很多计算机视觉任务中的性能已经超过了传统方法,所以尝试在发票系统中使用神经网络模型替换传统的算法完成目标区域定位任务,为了更好满足比传统算法更好在检测速度与检测精度之间作更好的平衡,且相对于传统图像匹配算法具有更好的鲁棒性,改进了YOLOv3原算法的一些基本设置,适配于发票背景下进行目标定位,并对比了YOLOv3算法与传统SVM+HOG算法在目标检测上的速度。3.基于卷积神经网络的字符识别由于汉字的特殊性,早前发票识别系统大多很好的解决了数字识别的难题,并实现了很高的精确度,但是并没有有效解决汉字识别的问题。过去,汉字识别多使用一些人工规则来完成识别匹配,如特征点匹配、像素点匹配、计算图像欧氏距离和余弦距离的匹配。使用这些匹配方式会随着模板和种类的数量增多而导致识别性能下降。为了克服模板匹配中由于噪点干扰、半遮挡、模糊、尺度不一致或者角度不一致产生的匹配失败的困难,现对系统中识别模块使用深度学习技术中的卷积神经网络进行字符识别,使图像能在一般情况下都能完成精确的识别。
其他文献
患者男,17岁.因右腰痛伴肉眼血尿2天急诊入院.查体:右中、下输尿管点压痛阳性,无反跳痛及肌紧张,右肾区叩痛明显.尿常规:WBC(++),RBC满视野.B超示右肾盂少量积液,右输尿管上
CRF是由多种慢性疾病造成肾单位破坏,丧失正常功能,不足以充分排出代谢废物和维持内环境稳定,以至发生泌尿功能障碍和内环境紊乱,包括代谢废物和毒性物质的滞留,水电解质,酸碱平衡
钙钛矿型过渡金属氧化物具有丰富的物理现象,包括高温超导电性,巨磁阻效应,金属-绝缘体相变等,因此被应用于传感器,磁记忆等许多领域。过渡金属氧化物中,第八主族元素由于具
对于医疗腐败必须坚持以德治医的方针和相应模式.既要重视个体道德建设和制度伦理建设,也要用建设和谐社会的理念来融洽医患关系.个体道德建设着重于医务人员的个体向善,制度
国防生教育是我国国防教育的重要组成部分,依托普通高等教育培养军队干部,是新世纪新阶段加强军队建设的重大战略决策。作为国防建设的后备人才,国防生素质高低对国防建设产生了
随着世界范围内人口老龄化的提升,劳动人口的老龄化也在逐步升高,而劳动人口老龄化最常见的问题之一,便是年长员工职业生涯中晚期的发展。与此同时越来越多的研究聚焦在年长
本文对图像分割中基于水平集的偏微分方程模型解的存在性进行研究,主要采用偏微分方程理论以及图像处理中偏微分方程粘性解理论。对模型的解的存在性和唯一性问题在理论上进
运用解析几何及数理统计的方法对传统湿渣法进行了改进。改进后湿渣法的精度大大提高,并对传统湿渣法的误差来源进行了分析。