基于深度学习的光学字符识别技术研究

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:propelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别(OCR)技术目前主要是在文档及证件识别等方面应用。其中文档识别可以把手写文档或印刷文档的文字信息数字化,快速并准确提取有效信息。现阶段飞速发展的深度学习应用到OCR,不仅适用不同的场景,而且字符识别的准确率可以得到提高。本文的主要工作是利用深度学习建立手写字符识别框架,并在智能手机实现。OCR的步骤主要是文字区域检测,字符切割和识别。字符的识别作为本文的研究重点,因此结合深度学习对此进行优化。首先总结了可用于字符识别的深度学习网络。详细分析了深度卷积神经网络与循环神经网络架构,并介绍了深度学习框架Tensorflow。其次,由于数据集的规模对于训练模型至关重要,因此扩充了数据集。基于文本行图像书写尺度的可变性,利用多尺度文本来扩充数据集。然后,改善对系统性能好坏影响极大的特征提取。利用残差思想对卷积神经网络进行适当的改进与优化,改变特征提取过程中信息的传播方法,提高特征提取的准确率。最后,针对传统OCR应用时设备便携性差问题,进行改进。过去在使用OCR技术识别文字时,文档图像主要是通过扫描仪或照相机等设备来获取,可适用场合受限。因此本文提出基于智能手机的手写字符识别技术的研究,利用智能手机近年来大幅度提高的计算能力,实现在智能手机上的文档图像获取和字符识别,从而解决上述问题。本文通过实验验证了残差卷积网络框架对文档图像特征提取的有效性,并且在Android智能手机上实现的手写文档图像的字符识别功能,增加了实用性。
其他文献
目的比较单通道与双通道经皮肾镜碎石术(PCNL)在治疗复杂性肾结石的优缺点。方法对2009年1月-2017年10月收治复杂性肾结石128例患者,其中58例采用双通道PCNL(为观察组),70例
随着便携式消费类电子产品的应用越来越广泛,电源管理芯片已经成为集成电路行业最关注的问题之一。低压差线性稳压器(LDO)由于其输出噪声低、结构简单并且具有良好的负载调节
11月29日,新组建的上海市应急管理局挂牌成立。挂牌成立10天来,上海市应急管理局已对4家中央在沪和地方国有企业集中下达了责令限期整改指令书,对其中3家企业安全生产涉嫌违
β-环糊精(β-CD)具有特殊的圆筒结构,空腔疏水,外缘亲水,能够通过主-客体反应包合许多小分子物质,在医药、纺织、食品、纳米科技、膜技术等领域得到了广泛的研究应用。但β-
民间服饰图案作为丝绸印花设计中重要组成部分,为其设计与取材都提供了广泛的设计思路与素材来源。中国传统文化博大精深,民间服饰图案与丝绸都是其中不可或缺的组成部分,将
目的探讨献血者初筛检验在血站血液检测中的重要性。方法选取于2016年10月至2018年10月无偿献血者220例分为观察组和对照组,观察组进行血液初筛检测;对照组进行常规血液检测
经历了漫长的发展时期,欧洲小提琴音乐发展的巅峰在浪漫主义时期已初见端倪。这时,小提琴的重要体裁是协奏曲,小提琴的音乐演奏形式达到顶峰,而且表现出独具特色的音乐风格。
数年前,一位名叫安娜的女士出现在汉堡刑事警察局,她衣衫华贵,神情冷漠,一副上流社会的不凡气派。但在衣衫覆盖之下的躯体上,却是斑痕累累,新创旧痕交加,简直惨不忍睹。据她
城市污水处理系统包括污水收集系统、污水提升系统及污水处理厂三部分,其中,污水管网承担着收集和转输各类污废水及部分天然降水的任务,而污水提升泵站则为污废水顺利输送到污水处理厂提供保障。当前,城市老城区的排水管网由于雨污分流改造困难等原因,合流制污水管网占据很大的比例,且该部分管道建设年限长、设计标准偏低,存在着很大的安全隐患;而作为污水处理系统重要组成部分的污水泵站,具有高能耗、进出水不均匀性等特点
利用大理气象站的1960—2014年逐日降水和气温资料,计算出12个极端气候指数,采用线性趋势分析,M-K方法、Pettitt法相结合和谐波分析等方法对极端气候指数的趋势、周期和突变