基于无监督学习的铭牌文字定位和识别

来源 :厦门大学厦门大学 | 被引量 : 0次 | 上传用户：landy_st

【摘要】

：

文字是表达人类思想和情感的重要载体，获取自然场景图像中的文字信息从而实现图像内容的理解，将为人们的生活提供极大的便利，因此场景图像中的文字定位和识别也一直受到学界业界

【作者】

：

孙晔

【机构】

：

厦门大学

【出处】

：

厦门大学厦门大学

【发表日期】

：

2015年期

【关键词】

：

铭牌图像文字定位文字识别无监督学习卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文字是表达人类思想和情感的重要载体，获取自然场景图像中的文字信息从而实现图像内容的理解，将为人们的生活提供极大的便利，因此场景图像中的文字定位和识别也一直受到学界业界的关注。铭牌图像是场景图像中的一个特殊领域，铭牌图像识别对于电力相关企业对设备进行管理、维护和检修等具有重要的意义，但由于铭牌本身材质特殊加之所处环境恶劣，铭牌图像常常存在着反光、污渍、模糊、划痕等退化，这为铭牌文字信息的获取带来了诸多困难。　　传统的针对扫描文档的OCR方法很难做到复杂场景中的文字识别;现有的场景文字识别方法又通常只针对自然图像中的英文字符，虽已对英文有了不错的识别成果，但由于汉语文字类数多、结构复杂的特殊性，在汉字识别领域一直没有明显的突破。鉴于现有的识别方法无法直接满足铭牌文字在定位和识别方面的任务要求，因此本课题将围绕无监督学习在自然场景中对汉文字的定位和识别进行研究，并对特定领域——铭牌识别规划具体的解决方案。　　本文在深度学习架构下，将无监督学习和卷积神经网络相结合，以解决铭牌文字定位和识别问题，主要研究内容与成果如下:　　1.提出基于K均值无监督预训练卷积神经网络的铭牌文字定位方法。首先通过多尺度Retinex法和四点法作为预处理，解决不均匀光照和图像畸变等对后续铭牌文字定位、识别的影响。再利用k均值聚类法无监督初始化卷积神经网络，并以此获得符合汉字结构的鲁棒特征用于铭牌文字定位，该定位方法可以很好解决铭牌图像分辨率差、图像退化严重导致难以定位的应用难题。　　2.提出基于PCA预训练卷积神经网络的铭牌文字识别的方法。首先，给出一种改进的Bradley二值化预处理方法二值化铭牌文字图像，以减少分类难度;其次，利用投影法两次裁剪以便从词条中获得待识别单字;最后采用PCA无监督预训练方式与CNN结合的PCAnet卷积神经网络用作铭牌文字识别。一方面PCAnet提取了高表征力的特征，识别准确率优于人工设计特征的浅层算法;另一方面利用了PCAnet可以利用大量的无标数据以及训练速度更快等特点，以应对汉字字符种类繁多且容易获得大量无标样本以及铭牌识别字库更新频繁需要频繁训练网络的问题。　　本文中提出的方案在由国家电网提供的图像库上进行了验证，获得了98.14％的定位准确率和94.47％识别准确率，对于铭牌识别问题提供了一种只需拍照即可以获取铭牌文字信息的有效方案。值得指出的是，本文中提出的定位识别方法不仅适用于铭牌识别，只需对训练库稍作改动，就可以为车牌、广告牌等领域的文字获取提供良好的可行解决方案。这种将无监督学习应用于深度网络系统学习训练的方法，契合互联网时代无标数据特别多的特点，具有一定的理论价值和实际的应用前景。

其他文献

二维经验模式分解及其在图像分析中的应用

二维图像的非平稳性、非线性性和多尺度性使得图像分析一直是计算机视觉中富有挑战性的问题。由于图像灰度值在空域上的变化是随机的,尺度和幅值变化都没有规律可言,因此可以

学位

经验模式分解(EMD)AM-FM表示固有模式函数(IMF)二维经验模式分解(BEMD)图像滤波

手形和掌纹识别算法的研究

该文首先在对大量的相关文献和资料进行广泛而深入地分析的基础上,对生物特征识别技术的基本原理和一些主要的识别技术的目前研究发展状况进行了比较全面的综述.介绍和总结了

学位

识别技术生物特征识别技术分类决策算法掌纹识别

基于DNS的对象名称服务系统研究与设计

目前,射频识别技术(RFID)作为一种能够实现物品供应链操作,商品跟踪和存货控制的技术正广泛受到关注。随着射频识别技术在物体标识方面应用的成熟,人们正在致力于兴建一个全

学位

无线射频识别RFID网络对象名称服务域名解析

宽带自组织网络通信系统射频前端关键技术研究

宽带自组织网络通信系统是最近几年来无线通信领域新兴的分布式无线通信系统，在工业、消防、安保、应急救灾等领域具有非常重要的作用，具有广阔的应用前景。　　宽带自组织网络

学位

收发机射频前端无线通信宽带自组织网络

基于ANFIS的信道估计算法研究

移动通信技术已经成为现代通信技术中应用最广泛、发展最迅速的技术之一。第三代移动通信系统即将商用。而满足更高速率,更大容量,为用户提供宽带多媒体业务接入的下一代通信

学位

无线通信系统信道估计ANFIS误码率通信仿真

复杂环境下的北斗卫星捕获关键技术研究

随着北斗二代卫星导航系统的投入使用，对其用户终端定位设备的研发需求也变得日益迫切。北斗二代卫星导航系统为了提高信号的互相关性能，引入了二次编码调制技术，该技术使符号位

学位

卫星导航系统信号捕获并行搜索算法特征序列复杂环境

一种基于树形骨干网的分簇算法设计

Ad Hoc网络是由一系列独立于固定基础设施的移动节点所组成的多跳无线网络,灵活、快速的组网方式使其成为了当前无线网络研究中的热点之一。由于Ad Hoc网络中各节点的自由移

学位

Ad Hoc网络分簇算法核心树路由协议树形骨干网

高频雷达相位编码信号的应用研究

高频雷达作为一种探测手段,从其诞生以来就一直在军事领域起着十分重要的作用。针对高技术局部战争的特点,特别是低可观测目标的大量出现,给防御方的防御能力提出了更高的要

学位

高频雷达跳频信号多载波相位编码波形设计信号处理

802.16e系统仿真平台的实现及调度算法仿真

802.16e标准定义了无线宽带城域网MAC层和物理层的技术规范。在MAC层，标准将不同的业务流归类为UGS、ertPS、rtPS、nrtPS和BE五种业务类型，分别对每种类型的业务流提供不同的Qo

学位

802.16e宽带无线接入MAC服务流调度QoS

监控系统的实时数据库设计与实现

为了实现对现场的运行设备进行实时的监视和控制,监控系统必须具备很好的实时性和稳定性。作为整个监控软件的核心支持,实时数据库将实时技术和数据库技术相结合,数据和事务

学位

实时数据库监控系统事务调度

基于无监督学习的铭牌文字定位和识别

其他学术论文