异构物流票据环境信息的提取与识别分析技术

来源 :上海第二工业大学 | 被引量 : 0次 | 上传用户:end001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,常见的自然场景文本识别任务,在高效管理数据领域和准确性方面都取得重大突破。但是在异构物流票据中,其版面庞杂,种类繁杂,缺乏统一的票据模板来检测异构票据信息。针对章印遮盖文字信息以及发票内容因印刷产生偏差的情况,物流票据文字识别技术对精确率有着更高的要求。因此,相较于普通的文字识别来说,异构物流票据信息识别具有更高的难度。为此,本文开展的异构物流票据环境信息的提取与识别分析技术研究,具有十分重要的工程应用前景。综上,本文票据识别过程包括票据图片预处理、提取票据特征、特征降维、票据分类、文本检测以及文字识别部分。论文主要研究内容与贡献如下:1.为了减少外界干扰因素,获取票据有效信息,本文对票据进行了统一的图像格式转换,并对图像做了灰度化、二值化、降噪以及去除章印等预处理工作。2.针对异构物流票据没有统一的票据模板这一问题,本文提出基于PCAMFTIWPSO-SVC模型作为票据分类器。以统计票据图片像素梯度幅度以及梯度方向建立方向梯度直方图HOG来提取票据特征,使用主成分分析PCA算法进行特征降维,减少票据冗余信息,降低计算量,构建票据分类数据集。最后,多信息融合惯性权重粒子群算法MFTIWPSO对支持向量分类SVC模型进行调参优化,其相对于初始分类器而言,其精确率提高18.31%。3.关于内容偏移所导致的无法准确定位票据文本坐标的难点,本文通过飞浆工具手动标注异构票据文本坐标,构建票据文本定位数据集,其相对于一般公开文本数据集更具有针对性。借助基于深度学习的CTPN算法和DBNet算法建立文本定位模型。从算法运行时间以及文本定位准确率综合考虑,进而确定CTPN为最佳票据文本定位算法。4.以提高票据文本识别的准确度为目的,本文采用公共字符数据集构建票据字符的训练数据集,提出并实现一个基于深度学习的端与端之间的文字识别框架CRNN,有效识别任意长度文本序列。实验结果验证了CRNN文字识别模型的有效性,字符识别平均准确率可以达到89.11%。
其他文献
传统的金属氧化物由于具有成本低廉、制备方法简便、操作可控的优点成为气体传感器领域的研究热点。但是在实际生产应用中,金属氧化物气体传感器灵敏度低、工作温度高、稳定性差、使用寿命短等缺点限制了它在气体传感器方向的长足发展。碳纳米角(CNH)是一种新型的碳纳米材料,与棒状碳纳米管和层状石墨烯相比,碳纳米角具有独特的球形形貌,由于碳纳米角具有比表面积大、热稳定性强、孔隙率高等特点获得了广泛的关注。Ti3C
学位
近年来,臭氧(O3)污染对全国各地环境空气质量的影响十分突出,挥发性有机物(Volatile Organic Compounds,简称VOCs)是O3的重要前体物之一。近期国家出台的各项文件指出企业需要针对挥发性有机液体储罐、装卸、敞开液面等10个关键环节进行VOCs污染治理,可见亟需对有机液体装卸环节进行治理。本文以某工业园区六家典型企业作为研究对象,开展有机液体装卸环节挥发性有机物排放特征研究
学位
新能源汽车产业的发展是我国减少能源消耗和降低二氧化碳排放的重要措施,整车控制器作为新能源汽车核心部件之一,其软件测试是控制器开发过程中必不可少的环节。随着新能源汽车上电气电子设备数目显著增加,整车控制器功能变得越来越复杂。为解决传统汽车控制器测试过程中存在环境配置和筛选测试脚本等的大量人力成本消耗、测试时间局限、测试决策单一、效率低下、准确度低的问题,本课题根据汽车企业实际需求,设计并实现了基于持
学位
随着无线通信技术的出现及蓬勃发展,其在当今社会中的应用越来越广泛。其中在自媒体技术的推动下,使得无线语音传输系统的研究与开发具有较大的市场需求和应用前景。与此同时,也就意味着对系统语音传输的质量以及语音延迟性提出了更高的要求。而对于无线通信,信源的质量和信道的容量是无线通信中最主要的两个因素,也是以往研究的重点。本文中采用的OPUS音频编解码技术是从信源的角度在信道容量一定和不影响语音质量的情况下
学位
臭氧是一种高效广谱无残留污染的气体消毒剂。新冠肺炎在全世界的大流行显著地影响了公共安全和健康。低浓度的臭氧能够灭活新冠病毒。负离子发生器是产生臭氧的一种安全高效的方法,通过多针对板电晕放电,在针板电极之间会形成离子流,释放出一定浓度的臭氧。在负离子发生器中电极板间距与臭氧释放的关系研究中,不同的实验观察出现矛盾的结果,使得理论解释变得非常困难和复杂。本实验室系统地研究臭氧释放速率与针板电极间距离和
期刊
异丙醚(IPE)可以作汽油添加剂,解决含铅汽油问题,也可作化学工业上的溶剂,与异丙醇(IPA)混合溶解纤维,同时可以处理煤气厂污水来解决水污染问题。它可应用到医药中间体,也可应用至煤制溶剂或者制备生产香料等工业中。另外,异丙醚还可应用于腈纶硫氰酸钠的一步法萃取回收等。在一定条件下,它也可作为生产乙醇的一条可行的工艺路线。近年来,随着人们对异丙醚的优异性能的认识,为异丙醚的发展带来机遇。分子筛催化异
学位
钢阻尼器是增强建筑物抗震性能的重要手段,它通过吸收外部振动能量,从而减弱振动对构件的影响,具有良好的消能减震效果。钢阻尼器在强震来临时通常需要承受高应变低周疲劳,这对阻尼器用钢(低屈服点钢,通常为(超)低碳铁素体钢)的低周疲劳性能提出了较高要求。铁素体钢在循环变形过程中交滑移频繁发生且塑性变形不可逆,在此过程中伴随着组织稳定性降低及应变局域化;随循环进一步进行,疲劳裂纹往往萌生于材料表面的应力集中
学位
近年来,随着互联网和计算机技术的发展,各个领域的质检投诉数据积累越来越多,因此对质检数据进行分类的研究具有重要意义。目前主流的三种分类方法字典匹配、机器学习模型、深度学习模型均存在共性问题,字典匹配对于词库依赖度较高,机器学习模型和深度学习模型都需要较好的词嵌入表示。针对以上问题,本文基于质检领域数据将字典匹配、深度学习模型进行组合提出一种新的分类方法进行投诉文本的分类。主要贡献如下:(1)构建基
学位
在信息技术快速发展的新形势下,高校围绕立德树人的根本目标,开展线上线下协同育人实践,助力青年大学生全面成长成才。但当前高等外语教学在评价环节存在模式传统僵化、以终结性评价为主、不关注综合素养、评价工具落后等弊端。外语教学工作者应结合多元智能和建构主义理论,通过混合多方主体、拓宽评价内容、融合信息技术工具、注重动态评价、发挥多元评价功能等途径,积极构建线上线下混动教学模式下的大学英语多元评价体系。
期刊
电子及电动(汽)车行业的发展产生了数量巨大的废旧锂电池,其中含有的重金属如镉、镍、锰等均会对人体产生毒性。同时,废旧锂电池中的这些金属,也是潜在的矿产资源。对锂电池进行有效回收可同时解决环境污染和资源缺乏问题。本文通过人工拆解与机械研磨获得了锂离子电池负极材料与塑料,将其与氧化铁通过碳热反应制备石墨负载零价铁(ZVI/G)、塑料基碳材料负载零价铁(ZVI/PP)、石墨及塑料基碳材料负载零价铁(ZV
学位