基于深度学习的自然场景门牌多数字识别

来源 :广东技术师范大学 | 被引量 : 2次 | 上传用户:ylg2008asp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从背景复杂的图形图像中提取想要的字符信息,一直都是计算机视觉领域的研究热点和难点。自然场景门牌号码往往存在图像模糊、光照不均匀、弱光照等问题,会产生严重的畸变,导致字符识别效果很不理想。为此,本文以真实场景中拍摄的门牌号码图像为研究对象,对卷积神经网络(CNN)和生成式对抗网络(GAN)进行了较深入的研究,主要研究工作如下:一、针对当前单数字门牌号码识别率不高且算法复杂的问题,基于卷积神经网络构建了一个单数字识别网络。首先,构建了一个包括输入层、两层卷积层、两层池化层、全连接层和输出层总共七层的单数字识别网络,利用卷积神经网络实现对图像特征的自动提取;其次,为突出重要特征,在方法设计中还用灰度化手段来弱化自然场景中的背景信息,并应用一定比例的Dropout策略以防过度拟合;最后,通过在SVHN数据集上进行验证,单数字门牌号码的识别率达到95.72%,并与其他文章的算法结果进行对比,本文方法优于现有文章中的大多数算法。二、针对字符分割工作量大且容易导致误差的问题,构建一个能同时识别多位数字的深度卷积神经网络。在单数字门牌号码识别网络的基础上,使用循环网络生成字符序列,并融合卷积神经网络构建了一个12层的深度卷积神经网络。在不分割字符的情况下,该深度卷积神经网络能同时识别多位数字,在SVHN数据集上进行验证,取得了较好的效果。三、针对本文门牌号码识别的仿真结果分析中因数据集图像模糊而导致识别错误的问题,本文利用深度卷积生成式对抗网络生成新的高分辨率样本,在数据集训练过程中提取更加丰富的数据特征,提高识别模糊门牌号码的效果。四、基于以上研究,设计了一款用于门牌号码识别的APP软件,软件界面简单友好,主要有选择照片和图像识别两个功能,能够从相册中选择需要的门牌号码图片进行识别。
其他文献
股权激励作为上市企业对特定人员进行激励的一种有效方式,一直受到上市公司的重视,中国证监会于2005年发布的关于上市公司股权激励管理试行办法,更是引起国内各行业的上市企业的股权激励效仿热潮。然而代理人冲突的加剧在一定程度上阻碍了股权激励的有效性,如何规避其负面影响,促使被激励对象的行为与企业股东利益、企业发展保持一致,这是一个重要课题。本文基于前景理论对创业板企业创始人团队股权激励有效性进行实证分析
在奥斯卡获奖影片《珍爱》中,写作不仅是辅助主人公克拉丽丝·珍爱·琼斯识文断字、认识世界的手段,更是构建主体身份和发掘存在意义的关键。本文尝试借鉴存在主义心理学理论
报导了福寿螺在湖南长沙地区的繁殖生长特性、摄食习性以及对理化因子的抗逆能力 .平均每对亲螺年繁殖三级螺共 870个 ,重 3158g ,福寿螺喜食浮萍、菜叶、苎麻叶 ,中螺和成螺
目的观察虎力散外用对股骨粗隆间骨折术后切口肿胀的临床疗效。方法将患者随机分为两组,观察组予手术切口虎力散外治,无菌纱布包扎;对照组采用β-七叶皂苷钠静滴,手术切口无
<正>前言:很多年前,当乔布斯第一次在他的Macintosh台式计算机中捆绑预装了文字处理软件Word Star后,就自豪地说,这是为apple用户准备的一个伟大的思维工具。现在Word Star早
钢筋混凝土(RC)梁的挠度是混凝土结构设计中一个需要控制的重要指标。当RC梁剪跨区出现斜裂缝后,其剪切刚度会显著退化,剪切变形迅速增大。目前国内外主要混凝土结构设计规范均
全球的能源和环境都面临严峻的问题,节能环保的照明和显示技术成了 一个比较热门的研究方向,发光材料是一种解决照明问题的有效方法之一。依据三基色原理可知,把红、绿、蓝三
量子光学主要研究原子同光场的相互作用,它借助光对原子、离子等客体的量子态进行制备、探测和控制,其中电磁感应透明、电磁感应吸收等相干光谱和激光冷却与俘获原子是实现量子
<正>本文阐述了西门子SINAMICS S120 DC/AC多轴驱动系统在涤纶短纤生产设备上的应用,包括同步控制的算法和驱动系统的设置编程实践。0序言西门子S120系列是一种高性能、高精
随着“健康中国2020、健康中国2030”战略的推进,我国卫生事业向着全方位、全周期的健康产业发展。而伴随健康产业的兴盛,我国医高层次医学教育面临新的挑战,面对新医科、新