基于大规模特征学习的手写汉字识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wuyinfei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字的识别技术可以应用在国民经济的很多行业中,比如邮政地址识别使得自动邮件分拣成为可能,这样能够节省大量的人力。银行票据、税单、书籍、手稿等的识别可以将文档图像电子化,便于日后的管理、搜索和传输。手写汉字识别作为手写中文文档识别的一个基本组成部分,长期以来得到很多研究人员的关注。手写汉字识别的主要难点在于:字符类别集很庞大,而且存在很多相似字,书写风格差异导致不同书写者书写的同类字符变形很大。以上困难使得自由书写的汉字识别性能一直难以令人满意。鉴于此,本文在传统识别方法的基础上,通过分类器训练加速和大规模特征学习来提升手写汉字识别性能。主要工作和贡献如下。  (1)使用图形处理器(GPU)对训练过程做并行加速。为了提高分类器的泛化性能,增加训练集的规模是常用的方法。然而,大规模训练集对一些分类器的训练带来了挑战,特别是一些基于判别学习的训练方法。GPU拥有大量的浮点计算单元,适合于做大规模并行计算。本文使用GPU对判别特征提取(DFE)和判别学习的二次判别函数(DLQDF)分类器的训练过程做并行加速,使它们的训练速度分别提高了30倍和10倍,从而使大规模数据集训练成为可能。  (2)提出大规模特征学习方法提高识别性能。为了提高特征的判别能力,本文在原始梯度方向直方图特征的基础上,利用特征间的相关信息进行二次升维,得到了数万计的二次特征。然后在二次特征和梯度特征构成的高维特征空间中,使用判别学习获得低维特征子空间。由于在特征向量中引入了大量二次信息并使用了判别学习,最终得到的低维特征是具有较强判别能力的二次特征。最后,在该子空间上训练分类器。同时,为了增强特征学习和分类器的泛化性能,本文使用合成样本对训练集进行扩充。在手写汉字识别上,使用本文提出的特征学习方法和DLQDF分类器,我们获得了和深度卷积神经网络(deepCNN)相当的性能,而训练和识别的计算代价要比深度卷积神经网络低很多。
其他文献
近年来人工神经网络技术的研究受到国内、国际各领域的普遍关注,成为一种新兴的人工智能技术.它独特的结构和处理信息的方法,使之成为进行模式识别工作的合适工具.该文提出并
随着数字信号处理的普及、应用,卷积反演在光学成象、图象复原、系统辩识、信号恢复许多领域都有广泛的应用。如今,卷积反演已成为信号处理的一个专门课题而成为研究的热点,其应
该文从人机交互控制思想出发,阐述了对挖掘机机器人化的一种设计思想与实现途径.通过对挖掘机工作装置运动学和动力学的建模、分析以及对挖掘机工作过程的研究,提出了几种典
比较基因组杂交是细胞遗传学中的一种新方法,1992年由芬兰科学家Kallioniemi及其同事在Science上发表,用于实体肿瘤染色体研究.这种技术不需要对肿瘤细胞进行培养,并且可以获
本文在分析了工业燃煤锅炉动态特性的基础上,针对工业燃煤锅炉复杂、难于控制的特点以及在负荷变化大的工况下所出现的问题,设计了相应的给水和燃烧两个控制系统。 对于锅炉
随着自动化技术的不断发展和计算机技术的飞速进步,自动化控制的概念也发生着巨大的变化。在传统的自动化解决方案中,自动化控制实际上是由各种独立的、分离的技术和不同厂家的
该文重点研究了智能控制策略对异步电动机直接转矩控制系统性能的改善,同时,提出了"起动时间最优"的控制方法,显著地改善了直接转矩控制系统的起动性能.首先,为了对交流电动
该文针对近年来在移动机器人运动控制方面的两大研究热点问题——百完整约束轮式移动机器人的控制问题和多机器人协调运动问题——基于仿生策略,分别进行了系统而深入的研究.
该文将模糊系统分别与GMDH(Group Method of Data Handling)网络和CMAC(Cerebellar Model Articulation Controller)有机地结合起来,提出了两类新型模糊神经网络——模糊GMDH
该论文来源于抚顺乙烯化工公司的乙炔加氢反应器的先控项目.乙炔加氢反应器是乙烯加收系统的重要装置,能否有效的脱炔、减少乙烯损失直接影响着产品乙烯的纯度,因此,研究乙炔