基于深度学习的财务票据内容识别技术研究与实现

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:vensen_guo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
票据是信息时代的产物,是经济贸易的佐证,是消费者购物维权的有力依据。随着数字时代的到来,高校和企业财务报销中票据的重要性愈发显现。票据带来便利的同事也给财务人员带来了压力,在高校财务部门各种票据均以纸质粘贴单的形式保存,海量的票据单使得税务人员录入查询时效率极为低下。随着大数据分析的蓬勃发展以及深度学习时代的来临,深度学习技术在图像处理方面的运用也变的行之有效,各种基于深度学习的模型算法日益强大,并且已经有一些互联网企业做了各式各样的票据识别算法接口的服务,比如,阿里、腾讯和百度云提供了增值税发票和火车票识别接口。由于发票的信息具有丰富的隐私信息,一旦被人利用将造成不可估量的损失,例如滴滴打车隐私泄露,不法分子利用海量的票据信息分析个人的上班时间、乘车偏好和家庭居住信息等,这对个人乃至整个国家的安全都有着潜在的威胁。尽管日前有了成熟的商业接口,但考虑到长期使用带来的大量费用和海量的隐私信息,所以本文初衷为:在本高校局域网内部开发票据识别系统,并部署在自己内网服务器,在整个过程中数据不会流入公共网络,既保证了信息的安全,又节省了开销,同时满足内部需求。为了释放向相关人员的压力,同时保护数据的隐私;因此,本文设计了一套完整的基于深度学习的票据内容识别技术方案。首先,对采集到的图像进行图像分类,完成高校财务处常见的各种报销票据单的分类。接着,以增值税发票为例再继续完成增值税票据的文本定位和文本识别;在文本检测阶段,使用改进的CTPN网络完成对增值税发票中细粒度文本的检测和定位。最后,文本识别阶段分析了目前主流的CRNN识别方法,实现文本识别任务。本文的研究内容和成果主要如下:(1)图像分类任务详细分析近些年来的主流图像分类网络,如VGG、Res Net和Rep VGG等网络,并以Rep VGG网络为基准,融入注意力机制,对重要的特征图通道进行权值加重,实现SE-Rep VGG模型的训练,从而完成对采集到的票据类别的分类任务。(2)基于深度学习的文本检测任务对分类完的图像先进行版面矫正、利用图像明显线条特征进行分割,再用适合长文本的CTPN模型进行文本检测。在票据细粒度的文本场景下,CTPN文本定位模型在文本过程中会发生断连、遗漏未检测文字的情形。根据上述问题,本文给出了一个基于CTPN细粒度文本测试算法,该算法对CTPN模型网络进行的改造,重新设定了垂直锚点尺度以满足较细粒度的文本的特性;重新调整了主干网的结构以适应水平锚点的尺度,同时运用了FPN的设计思想以使底层特性与顶层特征相互融合,提高了检测的准确率。(3)基于深度学习的文本识别任务传统的文本识别方式,通常采用选择人工设计的特性,然后再利用如SVM等机器学习分类器对切割出来的文本特征加以辨识,但这种方式通常要求先设定好每个单独模型的参数,由于工作条件复杂,或者面临更复杂的场合,往往无法设计出泛化特性良好的模型。本文在分析CRNN各个模块的原理,实现文本识别任务。评价指标主要由每张增值税发票的识别率和检测时间,实验结果表明了该套整体方法的可行性和优势。
其他文献
古村落是指聚居年代久远,具有历史、文化、科学、艺术、社会、经济价值的历史村落。随着网络物理系统的出现,以互联网产业化和工业智慧化为标志、以人工智能和虚拟现实等技术融合为特征的第四次工业革命的兴起,对乡村的建设治理产生深远的影响。乡村是由多个子系统组成的复杂的开放性系统,城市化的发展改变了乡村的外部环境,影响了乡村内部系统的平衡,旅游业发展、人才流失、现代洋文化等多重因素叠加,正在侵蚀改变古村落原有
为了全面推动汽车制造行业的发展进步,积极整合新型材料,应用铝合金焊接技术,有助于更好地落实汽车轻量化发展规划,实现经济效益和环保效益和谐统一的目标。据此分析了汽车制造中铝合金焊接技术应用的意义,并对具体技术应用内容展开讨论。
本文在发展ETC+与智慧城市融合的背景下,提出了关于ETC+智慧停车建设的发展思路。首先介绍了ETC+智慧停车发展的必然需求,以及国家对ETC+智慧停车建设的鼓励性政策;其次分析了目前ETC+智慧停车发展前景的机遇与挑战;最后提出了ETC+智慧停车发展的技术路线,搭建ETC非高速场景应用的清分结算体系与ETC多场景服务平台、构建发票体系与制定标准规范,形成完善的智慧停车建设的发展思路,实现ETC+
深圳市罗湖区水贝布心片区属于城市核心亟需更新发展的区域。通过梳理产业发展环节、厘清产业发展诉求、引入产业发展理念,规划提出产业发展定位及策略,有效地指导城市片区的未来发展。通过重视产业引导及多方融合发展促进产业升级,从空间发展层面梳理产业和城市空间发展的关系,强调更新规划研究的统筹性与落地性,重点关注城市核心地段旧工业区的更新发展,实现对联系区域更新统筹发展的有效指导。
过渡环节是休息调整的环节,高质量的过渡环节有助于提高一日生活的质量。长久以来,过渡环节存在着整齐划一、教师高控、形式单一、消极等待等问题。巧选民间游戏优化大班一日生活过渡环节,创造自主、互动、灵活、有趣的氛围,让孩子在过渡环节快乐体验,精彩过渡。本文就以民间游戏优化大班一日生活过渡环节为主题,对此略作探讨。
数字经济深刻改变着中国经济的基本格局,在促进经济高质量发展中彰显出赋能共同富裕的独特功效。立足中国道路、中国情境、中国优势的现实基底,数字经济主要通过市场再转型、财政再增效和价值再重构实现经济均衡增长、财政效能优化与社会公平正义,通过市场机制、财政机制和社会机制三种力量的协同联动,赋能初次分配数量增加、二次分配效率提升和三次分配质量提高。在新发展阶段,需要推动数字经济深度嵌入“有效市场+有为政府+
本文通过介绍全网运行监测考核指标,分析ETC门架收费数据上传不及时原因,阐述主要设备故障处理方法,将福建泉厦高速公路ETC门架系统运维经验进行了总结分享,以期有效提高我国高速公路路网监测与运维保障水平。
采用XRD、压汞、微反 色谱等多种物理测试手段 ,对某化肥厂使用前后的水解催化剂的结构和性能进行了研究 ,指出催化剂失活的主要原因是催化剂表面沉积了大量硫和氯及其比表面下降 ,并提出了对策。
目的:探究肺结核患者药物治疗效果的影响因素。方法:选取我院2019-06~2020-03收治的84例肺结核患者,所有患者均采用常规异烟肼方案治疗,治疗6个月后采用WHO标准化治疗方案治疗中评定标准评估治疗效果,统计患者治疗情况,并了解患者一般情况,采用单因素和多因素分析肺结核患者药物治疗效果的影响因素。结果:84例肺结核患者中有效69例,占比82.14%;无效15例,占比17.86%;多项Logi
无人机集群具有低成本、大规模、高自主等特点,逐渐成为军事智能领域的新方向,广泛应用于渗透侦察、诱骗干扰、察打一体、大规模饱和攻击和区域封控等作战任务。但是相较于无人机集群各方面的快速发展,反无人机集群相关技术及运用严重滞后。本文通过梳理无人机集群项目发展现状,分析相关目标特性,结合现有反无人机集群手段现状说明面临难点,总结反无人机集群关键技术说明相关技术在发展过程中的不足。最后展望了反无人机集群作