基于YOLO的自然场景图像文本识别方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xuhaoumsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技发展的今天,人们的日常的生产生活中每天会发送和收获大量的图像,而大多数图像中会包含大量的文本信息。人们在生动图像的信息中会快速收获大量的内容,其中对人们影响最大的就是场景图像中带来的信息,但是场景图像就必然会出现图像质量不高的情况,如何能准确快速的识别文本中的信息成为一个急需解决的问题。自然场景图像文本识别技术在对图像文本识别时首先要多文本进行分类和检测,通过对文本定位提取文本特征序列进而再识别。而在计算机视觉领域的深度学习技术,通常会添加很多的参数和网络层级结构以求更好的预测效果。针对网络模型过深和场景文本识别效果不佳,本文提出了结合模型压缩的自然场景图像文本识别模型。该模型包括四部分:(1)基于压缩YOLO模型的文本区域检测算法,对参数过多的Yolo v3-Darknet 53网络进行剪枝处理。首先合并Darknet53网络的卷积层和BN层,然后在剪枝中利用正则化比例因子,删除对准确率影响不大的参数,最后利用剪枝后的Darknet 53网络进行文本定位检测。(2)文本区域过滤与提取,对上一步骤检测出的多个文本区域按分数排序,提取最优文本区域特征图。(3)字符区域提取,分割文本区域,得到字符的位置信息。(4)文本识别,双向LSTM中预测特征序列中的每一个特征向量的标签分布。最后将LSTM网络预测的结果进行处理,整合特征序列的结果,利用CTC技术解决输出与输入对齐问题,得到最终输出的结果。最后,为了验证论文提出的算法的有效性,论文以准确率(Precision)、召回率(Recall)和F值(F-Measure)三个方面作为评价标准,将剪枝后的Darknet 53深度网络在文本检测上同未剪枝模型和Seg Link,EAST模型进行横纵对比。进行了特征融合的自然场景文本图像的识别实验,并将结果同Word Sup,CTPN,EAST模型进行对比。实验结果表示,结合模型压缩和融合特征图的自然场景图像文本识别算法有效可行。
其他文献
煤炭、石油和天然气等化石燃料的开采和燃烧产生了大量的温室气体和有害物质,不仅引发了能源危机,也带来了诸多环境问题。通过电解水将间歇性的风能和太阳能存储为氢能是解决能源和环境问题的重要途径。以铁、钴、镍为代表的电解水氧析出反应(OER)催化剂成为近来研究的重点。开发高效稳定的镍铁基(Ni-Fe基)OER电催化剂,是高电流密度电解水工业应用的重要前提。本文研究了三种新型的三维(3D)Ni-Fe基电催化
电流分流监测器芯片在当今复杂的集成电路系统中起着重要的作用,通过监测电子设备中的电流大小可以判断电路是否正常工作,从而能实时监测电路的工作状态,以避免出现瞬间电流过大而烧毁电子设备的情况。因此,设计一款具有高性能的电流分流监测器来精确地检测流向负载端的电流是十分必要的。本论文设计的是一款结构新颖的双向电流分流监测器,该电路能在输入共模电压-4~4V的范围内实现精确的双向电流检测,且在保证精度的前提
结肠癌是一种常见的消化道恶性肿瘤,大多数结肠癌由腺瘤性息肉演变而来,因此早期筛查结肠息肉具有重要的临床意义,通过结肠镜检测息肉是最有效的方法,在检测过程中可能会漏检某些息肉,利用计算机辅助诊断技术,对结肠息肉图像分割就显得很重要。近几年,随着医疗辅助诊断技术的逐步发展,产生了多种结肠镜下息肉图像分割方法,其中包括传统的结肠息肉图像分割方法和基于深度学习的结肠息肉图像分割方法,传统的结肠息肉图像分割
天波超视距通信是工作在短波频段内一种重要的通信方式,在军事和民生用途中都发挥着不可替代的作用。通信系统中收发天线质量影响着整个系统的工作质量,因此收发天线的设计至关重要。短波通信系统要求天线不仅在工作频段上实现宽频带特性,而且需在满足俯仰面和方位面波束指向的情况下,实现全频段高增益。短波天线物理尺寸大,占地规模巨大,需配套相应支撑结构和地网建设,建造成本十分昂贵。如何合理设计短波天线,使其在保证电
随着我国经济社会的不断发展,为了与全国和各个行政区的经济情况相适应,社会保险(医疗/生育保险,养老保险,失业保险,工伤保险)和公积金领域的法律、法规和政策也在不断地调整。这种调整的必然结果就是:各个时间片段和行政区域上会产生大量的领域法律、法规、政策和司法解释等文本。可以发现,这些文本中对某一相同的领域术语的定义、解释和内涵不尽相同。这就产生了领域术语语义漂移现象。研究如何自动化获取这种漂移是有意
在当今社会快速发展信息高速传播的背景下,新的媒介技术的出现与发展改变了传统媒体格局下的信息传播格局,信息不再被“推给”受众,相反的是人们利用互联网将所需要的信息“拉出来”,并参与到创造信息的活动中,渗透到人们生活的方方面面。地位的相等,角色的转换,再加上网络的开放性、匿名性与交互性等特性,人们在网络上畅所欲言,发表着自身的看法与观点等等,也因此留下了用户海量的评论数据。庞大的数据信息看似毫无用处,
路由协议是无线传感器网络(Wireless Sensor Network,WSN)的关键通信协议,对WSN的性能有着重要影响。与传统的确定性路由相比,机会路由充分考虑了无线信道的广播特性、时变性和干扰不规则性,有效的提高了无线多跳网络的吞吐量和传输可靠性,已成为无线传感器网络路由协议研究的热点之一。然而,现有的机会路由协议大多在节点持续工作的状态下运行,能量消耗很大。低占空比技术将节点置于周期性的
弱胶结软岩遇水膨胀、泥化,造成巷道围岩变形大、支护结构破坏,严重影响安全。以围岩松散破碎、易泥化水解、底臌变形严重的王洼二矿21采区下部车场为研究对象,通过相关资料查阅、现场调研、理论分析、实验室试验、数值模拟以及现场观测等研究手段,系统地分析了 21采区下部车场弱胶结软岩岩巷的变形破坏特征、破坏原因并提出了切实有效的支护技术。通过围岩岩样XRD、XRF以及电镜扫描得到巷道围岩的成分组成以及微观结
随着经济和技术的快速发展,各个产业在地理上的集聚现象也越来越显著,尤其是高新技术产业集群,一方面它能够促进地区经济增长,发挥地区优势,另一方面技术的快速发展也使得高新技术产业集群进一步促进我国对外贸易结构的转型和升级。而与此同时,出口复杂度作为一种能够解释并预测经济增长的驱动力,它的提升在我国经济处于新常态的背景下实现经济动力从要素驱动、投资驱动到创新驱动的转换以及提升发展中国家出口竞争力具有重大
随着生产全球化和制造企业的规模化,分布式生产调度在各个大型制造企业中广泛应用,成为车间调度研究领域的重点研究问题。分布式车间调度问题的目标是在各约束条件下,对工件