论文部分内容阅读
手写汉字的识别技术可以应用在国民经济的很多行业中,比如邮政地址识别使得自动邮件分拣成为可能,这样能够节省大量的人力。银行票据、税单、书籍、手稿等的识别可以将文档图像电子化,便于日后的管理、搜索和传输。手写汉字识别作为手写中文文档识别的一个基本组成部分,长期以来得到很多研究人员的关注。手写汉字识别的主要难点在于:字符类别集很庞大,而且存在很多相似字,书写风格差异导致不同书写者书写的同类字符变形很大。以上困难使得自由书写的汉字识别性能一直难以令人满意。鉴于此,本文在传统识别方法的基础上,通过分类器训练加速和大规模特征学习来提升手写汉字识别性能。主要工作和贡献如下。 (1)使用图形处理器(GPU)对训练过程做并行加速。为了提高分类器的泛化性能,增加训练集的规模是常用的方法。然而,大规模训练集对一些分类器的训练带来了挑战,特别是一些基于判别学习的训练方法。GPU拥有大量的浮点计算单元,适合于做大规模并行计算。本文使用GPU对判别特征提取(DFE)和判别学习的二次判别函数(DLQDF)分类器的训练过程做并行加速,使它们的训练速度分别提高了30倍和10倍,从而使大规模数据集训练成为可能。 (2)提出大规模特征学习方法提高识别性能。为了提高特征的判别能力,本文在原始梯度方向直方图特征的基础上,利用特征间的相关信息进行二次升维,得到了数万计的二次特征。然后在二次特征和梯度特征构成的高维特征空间中,使用判别学习获得低维特征子空间。由于在特征向量中引入了大量二次信息并使用了判别学习,最终得到的低维特征是具有较强判别能力的二次特征。最后,在该子空间上训练分类器。同时,为了增强特征学习和分类器的泛化性能,本文使用合成样本对训练集进行扩充。在手写汉字识别上,使用本文提出的特征学习方法和DLQDF分类器,我们获得了和深度卷积神经网络(deepCNN)相当的性能,而训练和识别的计算代价要比深度卷积神经网络低很多。