基于卷积神经网络的自然场景中数字的识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:chentong85952000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着人类社会步入大数据时代,越来越多的多媒体数据涌入互联网中,面对海量的图片数据,人们迫切的希望可以利用计算机来自动识别处理这些多媒体数据,这也推动了计算机视觉这一领域的发展,其中从复杂背景的图片中提取文本信息一直是计算机视觉中的一个热点、难点。近年来神经网络在计算机视觉的各个方向都获得了突破性的进展,原因是相比于传统的人工提取图像特征的方式,神经网络最大的优势是可以自动提取高层特征,这在处理自然场景等复杂问题中尤其重要,而卷积神经网络又因自身结构的特点避免了处理图像这种高维数据带来的计算量的指数增长。因此使用卷积神经网络进行场景文本识别的研究也越来越成为主流。在这样的背景下,本文的整体思路是将自然场景下的数字识别分为字符定位和字符识别两个任务,首先利用卷积神经网络实现字符区域的定位,在获得字符区域的准确位置后,利用循环神经网络对该区域包含的字符串进行识别。在字符定位任务中,本文通过对物体检测任务和自然场景下字符识别任务的分析与对比,将目前在物体检测领域的一个主流框架Faster-RCNN应用于字符定位任务中,将字符串当作一个特殊的物体。在应用Faster-RCNN框架时针对字符识别任务对框架的输出、网络规模、Anchor比例和IOU阈值等几个方面做了优化。在字符识别任务中,本文使用卷积网络和循环网络融合的网络结构,用卷积网络提取特征,用循环网络生成最终的字符序列。分别训练这两个部分的网络,组成一个完整的识别系统,并在几个公开数据集上进行验证,最后在字符定位的精度方面获得了优于其他方法的效果。
其他文献
营业税改征增值税试点已于2012年1月1日起在上海启动,物流企业纳入本次试点范围。本文从试点的具体内容入手,总结了试点政策对物流企业的实施成效,并在分析试点工作中物流企
热力学分析主要包括以能量平衡为基础的能分析法和以火用平衡为基础的火用分析法。本文定性分析了两种方法的区别,并通过对某电厂锅炉系统的热力学分析,定量得出能分析和火用
企业风险管理是现代企业管理的重要组成部分,并在现代企业管理中发挥着不可或缺的作用。随着企业内外环境的变化,导致企业内部受托管理责任关系复杂化和受托管理责任领域、内
<正> 黄克功是共产党的高级干部,张灵甫是蒋介石的得力干将。黄克功杀死了自己的恋爱对象,张灵甫打死了自己的续弦之妻。同犯杀人之罪,毛泽东和蒋介石的处置却截然不同。 正
现在企业之间的竞争实质上就是人才的竞争,谁拥有企业发展所必须的优秀人才,谁就掌握了制胜的法宝。在竞争日益激烈的今天,如何留人以及如何用人是企业面临的重要问题。然而
实用性的图案与非实用性的绘画都是画者笔下的视觉表达对象,两者有着密切的关联。本文主要讨论了图案在传统中国画(尤其是工笔画)中的表现及影响。可概括为三点:图案被直接运
在高职高专院校教学过程中,《西方经济学》是经济管理类专业的一门公共必修课和专业基础课,但由于高职院校的学生基础知识相对薄弱,对经济现象缺乏观察与了解,而《西方经济学
<正>在1996年9月召开第一届世界民族音乐学学术 研讨会的9年后,2005年9月2-5日,在中央音乐学 院举办了主题为“研究世界民族音乐、共享世界音乐 资源”的第二届世界民族音乐
习近平总书记在党的十九大报告中指出"健全货币政策和宏观审慎政策双支柱调控框架",这是反思国际金融危机教训并结合我国国情提出的金融政策举措,对提高我国货币政策的有效性
<正> 二、有关音乐起源的几个问题 (一)早期鼓的发展 谈到音乐起源时,人们普遍认为鼓是一种最古老的乐器。许多人指出,近世绝大多数的“原始民族”都有鼓,而且往往是其中某些