论文部分内容阅读
增值税发票在社会经济活动中具有极其重要的意义和作用,特别是发票上有很多重要的信息需要存储在计算机上。为了降低人工录入的成本,本文设计了一款基于卷积神经网络的增值税发票自动识别系统。该系统是基于卷积神经网络的自动化系统,它包含了两个作用不同的卷积神经网络,一个用以检测目标区域,另外一个用以获得目标区域的具体字符信息。系统采用扫描仪对多张发票进行图像采集,系统主要由输入、预处理、切割、识别、定位、记录6个模块组成。增值税发票识别系统的关键模块是定位和识别,这两个模块的精度与速度决定了整个系统的好坏。传统的定位方法不能很好地平衡检测精度和时延性的问题,为了解决这一问题,在系统的定位模块中引入YOLOv3检测算法对目标发票目标区域进行定位,使目标检测能更好地提升检测精度的同时又不会产生过高的系统延迟。在字符识别方面,模板匹配具有自身的局限性,若原图像中的匹配目标发生旋转或大小变换,模板匹配的自身局限性决定了该算法在多尺度或图形略微畸变的情况下不能实现精确的匹配。在发票系统的识别模块中,为了解决模板匹配的局限性,采用了Inception卷积神经网络对字符进行识别,使图像能在一般情况下都能完成精确的识别。本文主要内容和成果如下:1.图像预处理模块改进本文在增值税发票内容自动识别系统的图像预处理模块中,针对发票倒置判断容易发生误判的问题,对发票倒转的判断条件进行了改进;在增值税发票内容自动识别系统中的切割模块中,针对人工设置阈值二值化分离前景背景不准确的问题,采用了大津算法对图片进行自适应阈值计算,为了解决局部有污点或者亮度不均的发票对象,把图像分成若干块采用大津算法。2.基于卷积神经网络的目标区域的定位由于新兴的深度学习卷积神经网络技术在很多计算机视觉任务中的性能已经超过了传统方法,所以尝试在发票系统中使用神经网络模型替换传统的算法完成目标区域定位任务,为了更好满足比传统算法更好在检测速度与检测精度之间作更好的平衡,且相对于传统图像匹配算法具有更好的鲁棒性,改进了YOLOv3原算法的一些基本设置,适配于发票背景下进行目标定位,并对比了YOLOv3算法与传统SVM+HOG算法在目标检测上的速度。3.基于卷积神经网络的字符识别由于汉字的特殊性,早前发票识别系统大多很好的解决了数字识别的难题,并实现了很高的精确度,但是并没有有效解决汉字识别的问题。过去,汉字识别多使用一些人工规则来完成识别匹配,如特征点匹配、像素点匹配、计算图像欧氏距离和余弦距离的匹配。使用这些匹配方式会随着模板和种类的数量增多而导致识别性能下降。为了克服模板匹配中由于噪点干扰、半遮挡、模糊、尺度不一致或者角度不一致产生的匹配失败的困难,现对系统中识别模块使用深度学习技术中的卷积神经网络进行字符识别,使图像能在一般情况下都能完成精确的识别。