基于神经网络的身份证文本信息提取设计与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户：huangxiaojuan

【摘要】

：

【作者】

：

唐月标

【出处】

：

浙江工业大学

【发表日期】

：

2020年08期

【关键词】

：

身份证图像图像预处理文本区域提取神经网络文本端到端识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的快速发展以及信息技术的逐步提高,文本识别技术在我们的生活和生产中的要求也越来越高。身份证是一种证明持有人的身份的一种证件,是每一个中国人重要的证明身份的证件。身份证的自动识别技术相对于人工提取的最大的优点在于快速、准确和安全。现在有很多的机构或者公司在没有受到公安机关的授权的情况下,对身份证信息的提取方法还是通过人工的手动提取,该过程不仅需要消耗大量的人力,而且在准确率上也不是很高。虽然在公安部门,酒店,网吧等一些场所都使用了一些高端的身份证识别仪器,但是该仪器购买所需要的价格是非常昂贵的,所以该仪器在生活中的应用不是特别普遍,但是身份证文本识别技术在我们的生活和生产中的需求量是非常庞大的,因此需要生产出一种实惠高效的身份证文本识别仪器,从而把该仪器应用到我们的生活中,以后学校在录用学生的信息、公司记录纸质表格上的信息等等都可以使用这个身份证文本识别系统,在其购买价格低廉的基础上还可以获得非常精准的结果,在以后的生产和生活中具有非常巨大的应用价值。我国的身份证的文本信息包括:姓名、性别、民族、出生年月、住址和公民身份证号码。本文基于神经网络对身份证的信息提取做研究,主要包括身份证图像的预处理、文本区域的提取与筛选以及文本的字符识别三个方面,并以论文的研究内容为基础,完整地设计出了一种高效快速的身份证文本信息提取系统。(1)为了提高整个身份证文本信息提取系统的识别效率,先对身份证图像进行尺度调整和灰度化,降低图像像素大小和通道数。为了提高后续文本识别的准确率,需要对身份证的图像进行倾斜矫正,倾斜矫正过程可分为基于神经网络的粗矫正和基于水平投影算法的精准校正,使矫正结果更加准确,提高后续的文本区域提取的准确率。(2)在进行文本字符识别前需要提取身份证图像中的文本区域,在文本区域提取上使用了一种新型的目标检测算法,把文本当做目标进行检测,整个算法通过神经网络进行搭建,其对文本区域的提取准确率有很大的提升,使整个提取出的文本区域的精确度也非常高。在得到大量的文本区域以后,接着要对文本区域进行筛选,最后得到有用的文本区域。(3)本文主要是为了获取身份证上的基本公民信息,比如姓名、民族、住址、身份证号码等等。在卷积网络和循环网络的基础上引入了CTC(Connectionist Temporal Classification,连接主义者的时间分类)的算法,可以实现对不定长文本字符的非分割式的端到端字符识别,识别的对象包括汉字、数字以及英文字母。鉴于上述研究,实现了基于神经网络的身份证文本信息提取系统的原型,主要包括身份证图像的预处理模块、文本区域的提取与筛选模块以及文本的字符识别模块。最后,在数据集上的结果表明,该系统在身份证文本信息提取的任务上取得了较高的准确率,较低的平均编辑距离和较快的识别速度。

其他文献

皖南古代铜矿的发现及其历史价值

【正】皖南产铜史,古籍屡有称述,名遐海内,至今以钢陵有色公司为中心的现代采铜业仍是国内六大产铜基地之一,素有“铜都”之称.过去关于这一地区铜矿采冶遗址鲜为人知.1986年

期刊

江木冲先秦时期皖南地区炼铜遗址历史价值

芦荟制剂外涂预防化疗药物致静脉炎的效果观察

目的:探讨芦荟制剂外涂预防化疗药物致静脉炎的临床效果。方法:选择2018年3月～2018年6月进行化疗的患者60例并随机分为对照组和干预组。在输注化疗药物时对照组静脉穿刺后不用

会议

芦荟制剂预防静脉炎

问题设计构建生态课堂的实践——以《指数函数及其性质（一）》教学设计为例

课堂教学是以教师创造性的教和学生探索性的学为双主体，以学生的发展为主线，联结双主体的桥梁就是“问题”。教师应充分利用学生的差异资源，对教学目标进行分解，设计出低起点、多

期刊

课堂教学教学设计指数函数问题设计生态性质教学目标学生

浅论初中语文课堂提问艺术的途径与思考

探究初中语文课堂提问艺术的途径与思考，增强课堂提问的趣味性、有效性和针对性，优化课堂提问方式，对提高课堂教学质量有着不容忽视的重要性。本文主要分析了提高初中语文课堂提

期刊

初中语文课堂提问艺术原因途径

原发性三叉神经痛患者自我调节疲劳、自我效能感与生活质量的关系研究

目的:调查原发性三叉神经痛患者自我调节疲劳、自我效能感与生活质量的现状及其影响因素,并探讨变量间的关系和作用机制,以期为制定和改善原发性三叉神经痛患者的身心健康状况及生活质量提供相关的参考依据。方法:本研究采用方便抽样的方法,选取2018年12月-2019年8月于山东省济南市某三级甲等医院神经外科就诊的237名原发性三叉神经痛患者为研究对象,采用一般资料问卷、简明疼痛评估量表(BPI)、自我调节疲

学位

三叉神经痛自我调节疲劳自我效能感生活质量

班主任的“爱”之秘诀

时代在发展，班主任一定要不断更新教育理念，永远走在时代的前面。小学班主任在工作中要懂得包容、理解、赏识学生，公平对待每一个学生，充分尊重、爱护、鼓励学生，看准时机，以思想教

期刊

班主任爱管理工作

二维扫描反射镜特性分析

在光学反射矢量理论基础上,对于二维扫描反射镜成像特性和扫描轨迹进行分析,给出了反射镜的作用矩阵、二维扫描成像的物像关系和像旋计算公式,及其的扫描轨迹理论计算公式。

会议

摆镜像旋角扫描轨迹二维扫描

眼袋分型与眶隔脂肪处理的方法

<正>眼袋的临床表现与眶隔脂肪的膨出情况有明显的关系,一般来说眼袋是因下睑眶隔脂肪经薄弱的下睑前壁膨出,在下眼睑部出现臃肿隆起所致。欧美的一些学者认为眼袋的形成是由

会议

微咸水间歇供水方式土壤水盐分布分析

为了研究间歇供水微咸水不同入渗方式对土壤水盐分布的影响,开展了一维积水间歇入渗试验,研究了微咸水矿化度分别为1.75、3和5g/L,及不同周期数和循环率入渗条件下的入渗特性

期刊

微咸水间歇入渗含水率含盐量Saline water intermittent infiltrationl moisture content soil s

基于神经网络的身份证文本信息提取设计与实现

其他学术论文