论文部分内容阅读
随着互联网的快速发展以及信息技术的逐步提高,文本识别技术在我们的生活和生产中的要求也越来越高。身份证是一种证明持有人的身份的一种证件,是每一个中国人重要的证明身份的证件。身份证的自动识别技术相对于人工提取的最大的优点在于快速、准确和安全。现在有很多的机构或者公司在没有受到公安机关的授权的情况下,对身份证信息的提取方法还是通过人工的手动提取,该过程不仅需要消耗大量的人力,而且在准确率上也不是很高。虽然在公安部门,酒店,网吧等一些场所都使用了一些高端的身份证识别仪器,但是该仪器购买所需要的价格是非常昂贵的,所以该仪器在生活中的应用不是特别普遍,但是身份证文本识别技术在我们的生活和生产中的需求量是非常庞大的,因此需要生产出一种实惠高效的身份证文本识别仪器,从而把该仪器应用到我们的生活中,以后学校在录用学生的信息、公司记录纸质表格上的信息等等都可以使用这个身份证文本识别系统,在其购买价格低廉的基础上还可以获得非常精准的结果,在以后的生产和生活中具有非常巨大的应用价值。我国的身份证的文本信息包括:姓名、性别、民族、出生年月、住址和公民身份证号码。本文基于神经网络对身份证的信息提取做研究,主要包括身份证图像的预处理、文本区域的提取与筛选以及文本的字符识别三个方面,并以论文的研究内容为基础,完整地设计出了一种高效快速的身份证文本信息提取系统。(1)为了提高整个身份证文本信息提取系统的识别效率,先对身份证图像进行尺度调整和灰度化,降低图像像素大小和通道数。为了提高后续文本识别的准确率,需要对身份证的图像进行倾斜矫正,倾斜矫正过程可分为基于神经网络的粗矫正和基于水平投影算法的精准校正,使矫正结果更加准确,提高后续的文本区域提取的准确率。(2)在进行文本字符识别前需要提取身份证图像中的文本区域,在文本区域提取上使用了一种新型的目标检测算法,把文本当做目标进行检测,整个算法通过神经网络进行搭建,其对文本区域的提取准确率有很大的提升,使整个提取出的文本区域的精确度也非常高。在得到大量的文本区域以后,接着要对文本区域进行筛选,最后得到有用的文本区域。(3)本文主要是为了获取身份证上的基本公民信息,比如姓名、民族、住址、身份证号码等等。在卷积网络和循环网络的基础上引入了CTC(Connectionist Temporal Classification,连接主义者的时间分类)的算法,可以实现对不定长文本字符的非分割式的端到端字符识别,识别的对象包括汉字、数字以及英文字母。鉴于上述研究,实现了基于神经网络的身份证文本信息提取系统的原型,主要包括身份证图像的预处理模块、文本区域的提取与筛选模块以及文本的字符识别模块。最后,在数据集上的结果表明,该系统在身份证文本信息提取的任务上取得了较高的准确率,较低的平均编辑距离和较快的识别速度。