基于神经网络的身份证文本信息提取设计与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:huangxiaojuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展以及信息技术的逐步提高,文本识别技术在我们的生活和生产中的要求也越来越高。身份证是一种证明持有人的身份的一种证件,是每一个中国人重要的证明身份的证件。身份证的自动识别技术相对于人工提取的最大的优点在于快速、准确和安全。现在有很多的机构或者公司在没有受到公安机关的授权的情况下,对身份证信息的提取方法还是通过人工的手动提取,该过程不仅需要消耗大量的人力,而且在准确率上也不是很高。虽然在公安部门,酒店,网吧等一些场所都使用了一些高端的身份证识别仪器,但是该仪器购买所需要的价格是非常昂贵的,所以该仪器在生活中的应用不是特别普遍,但是身份证文本识别技术在我们的生活和生产中的需求量是非常庞大的,因此需要生产出一种实惠高效的身份证文本识别仪器,从而把该仪器应用到我们的生活中,以后学校在录用学生的信息、公司记录纸质表格上的信息等等都可以使用这个身份证文本识别系统,在其购买价格低廉的基础上还可以获得非常精准的结果,在以后的生产和生活中具有非常巨大的应用价值。我国的身份证的文本信息包括:姓名、性别、民族、出生年月、住址和公民身份证号码。本文基于神经网络对身份证的信息提取做研究,主要包括身份证图像的预处理、文本区域的提取与筛选以及文本的字符识别三个方面,并以论文的研究内容为基础,完整地设计出了一种高效快速的身份证文本信息提取系统。(1)为了提高整个身份证文本信息提取系统的识别效率,先对身份证图像进行尺度调整和灰度化,降低图像像素大小和通道数。为了提高后续文本识别的准确率,需要对身份证的图像进行倾斜矫正,倾斜矫正过程可分为基于神经网络的粗矫正和基于水平投影算法的精准校正,使矫正结果更加准确,提高后续的文本区域提取的准确率。(2)在进行文本字符识别前需要提取身份证图像中的文本区域,在文本区域提取上使用了一种新型的目标检测算法,把文本当做目标进行检测,整个算法通过神经网络进行搭建,其对文本区域的提取准确率有很大的提升,使整个提取出的文本区域的精确度也非常高。在得到大量的文本区域以后,接着要对文本区域进行筛选,最后得到有用的文本区域。(3)本文主要是为了获取身份证上的基本公民信息,比如姓名、民族、住址、身份证号码等等。在卷积网络和循环网络的基础上引入了CTC(Connectionist Temporal Classification,连接主义者的时间分类)的算法,可以实现对不定长文本字符的非分割式的端到端字符识别,识别的对象包括汉字、数字以及英文字母。鉴于上述研究,实现了基于神经网络的身份证文本信息提取系统的原型,主要包括身份证图像的预处理模块、文本区域的提取与筛选模块以及文本的字符识别模块。最后,在数据集上的结果表明,该系统在身份证文本信息提取的任务上取得了较高的准确率,较低的平均编辑距离和较快的识别速度。
其他文献
介绍了合同节水管理的运行机制,结合合同节水管理模式在我国的经济环境运行中存在的风险,建立评价合同节水管理项目风险评价的指标体系,利用模糊数学评价的方法,对合同节水管
【正】皖南产铜史,古籍屡有称述,名遐海内,至今以钢陵有色公司为中心的现代采铜业仍是国内六大产铜基地之一,素有“铜都”之称.过去关于这一地区铜矿采冶遗址鲜为人知.1986年
目的:探讨芦荟制剂外涂预防化疗药物致静脉炎的临床效果。方法:选择2018年3月~2018年6月进行化疗的患者60例并随机分为对照组和干预组。在输注化疗药物时对照组静脉穿刺后不用
课堂教学是以教师创造性的教和学生探索性的学为双主体,以学生的发展为主线,联结双主体的桥梁就是“问题”。教师应充分利用学生的差异资源,对教学目标进行分解,设计出低起点、多
探究初中语文课堂提问艺术的途径与思考,增强课堂提问的趣味性、有效性和针对性,优化课堂提问方式,对提高课堂教学质量有着不容忽视的重要性。本文主要分析了提高初中语文课堂提
目的:调查原发性三叉神经痛患者自我调节疲劳、自我效能感与生活质量的现状及其影响因素,并探讨变量间的关系和作用机制,以期为制定和改善原发性三叉神经痛患者的身心健康状况及生活质量提供相关的参考依据。方法:本研究采用方便抽样的方法,选取2018年12月-2019年8月于山东省济南市某三级甲等医院神经外科就诊的237名原发性三叉神经痛患者为研究对象,采用一般资料问卷、简明疼痛评估量表(BPI)、自我调节疲
时代在发展,班主任一定要不断更新教育理念,永远走在时代的前面。小学班主任在工作中要懂得包容、理解、赏识学生,公平对待每一个学生,充分尊重、爱护、鼓励学生,看准时机,以思想教
在光学反射矢量理论基础上,对于二维扫描反射镜成像特性和扫描轨迹进行分析,给出了反射镜的作用矩阵、二维扫描成像的物像关系和像旋计算公式,及其的扫描轨迹理论计算公式。
<正>眼袋的临床表现与眶隔脂肪的膨出情况有明显的关系,一般来说眼袋是因下睑眶隔脂肪经薄弱的下睑前壁膨出,在下眼睑部出现臃肿隆起所致。欧美的一些学者认为眼袋的形成是由
会议
为了研究间歇供水微咸水不同入渗方式对土壤水盐分布的影响,开展了一维积水间歇入渗试验,研究了微咸水矿化度分别为1.75、3和5g/L,及不同周期数和循环率入渗条件下的入渗特性