基于大规模特征学习的手写汉字识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：wuyinfei1

【摘要】

：

手写汉字的识别技术可以应用在国民经济的很多行业中，比如邮政地址识别使得自动邮件分拣成为可能，这样能够节省大量的人力。银行票据、税单、书籍、手稿等的识别可以将文档图像

【作者】

：

周明可

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

手写汉字文字识别图形处理器并行计算特征学习理论

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

手写汉字的识别技术可以应用在国民经济的很多行业中，比如邮政地址识别使得自动邮件分拣成为可能，这样能够节省大量的人力。银行票据、税单、书籍、手稿等的识别可以将文档图像电子化，便于日后的管理、搜索和传输。手写汉字识别作为手写中文文档识别的一个基本组成部分，长期以来得到很多研究人员的关注。手写汉字识别的主要难点在于:字符类别集很庞大，而且存在很多相似字，书写风格差异导致不同书写者书写的同类字符变形很大。以上困难使得自由书写的汉字识别性能一直难以令人满意。鉴于此，本文在传统识别方法的基础上，通过分类器训练加速和大规模特征学习来提升手写汉字识别性能。主要工作和贡献如下。　　(1)使用图形处理器(GPU)对训练过程做并行加速。为了提高分类器的泛化性能，增加训练集的规模是常用的方法。然而，大规模训练集对一些分类器的训练带来了挑战，特别是一些基于判别学习的训练方法。GPU拥有大量的浮点计算单元，适合于做大规模并行计算。本文使用GPU对判别特征提取(DFE)和判别学习的二次判别函数(DLQDF)分类器的训练过程做并行加速，使它们的训练速度分别提高了30倍和10倍，从而使大规模数据集训练成为可能。　　(2)提出大规模特征学习方法提高识别性能。为了提高特征的判别能力，本文在原始梯度方向直方图特征的基础上，利用特征间的相关信息进行二次升维，得到了数万计的二次特征。然后在二次特征和梯度特征构成的高维特征空间中，使用判别学习获得低维特征子空间。由于在特征向量中引入了大量二次信息并使用了判别学习，最终得到的低维特征是具有较强判别能力的二次特征。最后，在该子空间上训练分类器。同时，为了增强特征学习和分类器的泛化性能，本文使用合成样本对训练集进行扩充。在手写汉字识别上，使用本文提出的特征学习方法和DLQDF分类器，我们获得了和深度卷积神经网络(deepCNN)相当的性能，而训练和识别的计算代价要比深度卷积神经网络低很多。

其他文献

基于神经网络的示功图识别研究

近年来人工神经网络技术的研究受到国内、国际各领域的普遍关注,成为一种新兴的人工智能技术.它独特的结构和处理信息的方法,使之成为进行模式识别工作的合适工具.该文提出并

学位

抽油井故障诊断示功图模式识别人工神经网络图象数据预测处理

双通道反卷积解的性质及快速算法

随着数字信号处理的普及、应用，卷积反演在光学成象、图象复原、系统辩识、信号恢复许多领域都有广泛的应用。如今，卷积反演已成为信号处理的一个专门课题而成为研究的热点，其应

学位

卷积反卷积单通道双通道DFS算法

挖掘机器人控制系统研究

该文从人机交互控制思想出发,阐述了对挖掘机机器人化的一种设计思想与实现途径.通过对挖掘机工作装置运动学和动力学的建模、分析以及对挖掘机工作过程的研究,提出了几种典

学位

挖掘机器人轨迹控制电液比例控制人机交互控制

比较基因组杂交自动图像分析中的关键技术

比较基因组杂交是细胞遗传学中的一种新方法,1992年由芬兰科学家Kallioniemi及其同事在Science上发表,用于实体肿瘤染色体研究.这种技术不需要对肿瘤细胞进行培养,并且可以获

学位

比较基因组杂交图像分析核型分析本底校正非特异性杂交

在负荷变化大的工况下的工业燃煤锅炉PI-模糊串级控制

本文在分析了工业燃煤锅炉动态特性的基础上，针对工业燃煤锅炉复杂、难于控制的特点以及在负荷变化大的工况下所出现的问题，设计了相应的给水和燃烧两个控制系统。对于锅炉

学位

工业燃煤锅炉负荷变化大的工况下单级三冲量控制PI-模糊串级控制变氧量燃烧调节规律

DQLON现场总线控制系统研究

随着自动化技术的不断发展和计算机技术的飞速进步，自动化控制的概念也发生着巨大的变化。在传统的自动化解决方案中，自动化控制实际上是由各种独立的、分离的技术和不同厂家的

学位

现场总线DQLON智能模块DOLON现场总线系统

模糊神经网络滑模变结构异步电动机直接转矩控制的研究

该文重点研究了智能控制策略对异步电动机直接转矩控制系统性能的改善,同时,提出了"起动时间最优"的控制方法,显著地改善了直接转矩控制系统的起动性能.首先,为了对交流电动

学位

异步电动机直接转矩控制模糊控制滑模控制神经网络控制MATLAB/SIMULINK动态仿真工具

移动机器人运动控制研究

该文针对近年来在移动机器人运动控制方面的两大研究热点问题——百完整约束轮式移动机器人的控制问题和多机器人协调运动问题——基于仿生策略,分别进行了系统而深入的研究.

学位

移动机器人运动控制仿生策略非完整约束理性遗传算法多机器人运动协调

模糊神经网络及在工业过程软测量中的应用

该文将模糊系统分别与GMDH(Group Method of Data Handling)网络和CMAC(Cerebellar Model Articulation Controller)有机地结合起来,提出了两类新型模糊神经网络——模糊GMDH

学位

模糊神经网络软测量模糊CMAC模糊GMDH网络裂解炉4-CBA

乙炔加氢反应器先进控制的研究与工程应用

该论文来源于抚顺乙烯化工公司的乙炔加氢反应器的先控项目.乙炔加氢反应器是乙烯加收系统的重要装置,能否有效的脱炔、减少乙烯损失直接影响着产品乙烯的纯度,因此,研究乙炔

学位

乙炔加氢反应器分布参数系统催化剂活性软仪表状态空间模型预测控制

基于大规模特征学习的手写汉字识别研究

与本文相关的学术论文