基于深度学习的自然场景文字检测算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:aini412319016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息化时代的来临,从大数据中挖掘更多的有用信息成为一种价值导向。而文本是获取信息的重要渠道,在自然环境中,文本信息无处不在,随着计算机视觉领域技术的不断发展,将自然场景中的文本信息转化为数字信息对提高机器对场景的理解能力有着重要的作用。神经网络的快速发展,使得基于深度学习的检测算法成为主流方法。本文通过对文字检测领域的主流算法进行研读,梳理了各类文本检测算法的流程和方法,主要包括基于目标检测的文本检测算法和基于实例分割的文本检测算法,在分析了两类算法的优缺点后,在可微分二值化文本检测算法的基础上,提出了一种基于文本特征增强和文本特征自适应融合的文字检测算法,该算法的主要工作如下:(1)为了解决基于分割的自然场景文本检测算法中语义信息丢失,导致大尺度文本漏检的问题,提出一种特征增强网络。通过向特征金字塔的原始分支中注入更多的空间上下文信息,对顶层特征图中的信息进行补充增强,减少顶层特征在向下传播过程中的信息损失,使特征金字塔获得更多的语义信息,更好的指导分割,提高了网络的分割精度。(2)为了改善不同层次的文本特征在融合时的冲突问题,提出一种文本特征自适应融合网络。不同尺度大小的文本在经过卷积网络后会被映射到不同层次的特征中去,可能会造成文本样本在某一层次特征图中被标定为正样本,而在其余层次的特征图中却被标记为负样本的情况,直接融合这些特征会得到一个次优的结果。自适应的文本特征融合网络,通过学习得到每个特征图的空间权重矩阵,然后以加权融合的方式,生成分割网络需要的较优特征图。最后,本文在公开的多方向文本检测数据集ICDAR2015和弯曲文本检测数据集Total-Text检测数据集上验证了算法。结果表明,在Total-Text数据集上,本文提出特征增强模模型和自适应特征融合网络将baseline的综合指标分别提高了1.36个百分点和1.1个百分点。在两个数据集上,与目前的主流算法相比,也具有一定的竞争力,特别是对弯曲文本的综合检测指标取得了85.4%的。从而验证了优化算法的有效性。
其他文献
装配式钢结构是我国建筑发展的重要方向。但我国对装配式钢结构抗震性能的研究尚不透彻,其工程应用与国外先进水平相比还有明显差距,因此迫切需要展开对装配式结构抗震性能的系统研究。本文通过开展低周往复荷载试验,对装配式复合墙板钢框架结构中主体结构与外挂墙板协同抗震性能进行研究。并利用有限元数值模拟方法,分析了轴压比、混凝土强度、墙板厚度等参数对结构整体抗震性能的影响。主要结论如下:(1)通过开展装配式复合
随着社会的不断发展进步,人们对于居住品质的要求也在日益提升。新建住宅中,高层建筑所占的比重逐渐加大,随之而来的高层住宅环境问题也日益受到关注。由于高层建筑对于所处地区的风环境较中低层而言更加敏感,因此设计师在设计阶段就需要调整设计策略,优化住区风环境,提升住区品质。本文的主要研究目的就是基于某一特定的设计背景,选取6个影响居住区风环境设计的主要因素,探讨由这些因素构成的不同居住区规划设计策略对于风
预焙阳极被称为铝电解工艺的“心脏”,其质量的优劣对电解铝最终产品有至关重要的影响。预焙阳极的生产工艺为从原料开始,经过煅烧、成型和焙烧最终得到预焙阳极成品,其中每道工序都有生产参数,各道工序的参数间存在影响关系。如何从预焙阳极多道生产工序的众多生产参数中找到影响最终阳极质量的关键因素,具有重要的研究和应用价值。本文从阳极生产工艺流程出发,采用改进的灰色关联分析和XGBoost算法,研发了阳极质量溯
在氧化铝生产工艺中,高压溶出是关键工序之一,其效果好坏将直接影响到氧化铝的质量和产量指标。实际生产中溶出效果的获得具有一定的滞后性,如果可以提前预测溶出率的大小,则可以依据预测结果,及时调整原矿浆原料配比和溶出温度、时间,从而改善溶出效果。本文首先对灰狼算法进行了改进,再利用改进后的灰狼算法分别优化XGBoost、支持向量回归(SVR)和极限学习机(ELM)算法,然后利用优化后的模型分别对溶出率进
随着我国西南地区交通事业的高速发展,一系列的工况复杂、施工困难的隧道工程也随之不断出现,如何保证隧道开挖过程中的安全生产成为了一个亟待解决的问题。同时,微震监测技术日益发展成熟,其利用传感器接收隧道围岩破裂产生的地震波,分析获得微震事件的时间、空间、强度和震源机制等相关信息,对地下工程灾害进行监测预警,已经成为业界公认的可以对隧道掘进过程中围岩稳定性进行监测的有效方法之一。与传统围岩监测技术相比较
应用明渠智能闸门设备对改善灌区水资源浪费严重的情况有显著作用,国内通过近些年来的不断学习结合自身科技水平的提高,目前已逐渐掌握了智能闸门的组成结构与控制技术核心。其中本文所在课题组于2014年开发了可远程自动计量智能闸门控制系统,然而经过部分地区长时间的实际应用测试却发现现有产品仍存在不少问题。其中面临的集中困扰是围绕在明渠较宽断面建设所安装的并联智能闸门,一方面是由于现有的控制设备不能较好提供支
涡轮发动机是航空航天领域取得重大突破的核心关键部件。热端部件性能的优劣是衡量涡轮发动机寿命的重要指标。热端部件长期工作在高温高压等复杂多变的严峻环境中,所以它对制造工艺和原材料性能要求较高。目前工业上通常选用高温合金作为热端部件的加工材料。正是由于高温合金良好的抗氧化、抗腐蚀、耐高温特性,可以作为制造涡轮发动机热端部件的原材料。它在加工过程中容易出现材料大变形,切削热量高等特点,因此属于典型的难加
由于科技的进步与现代智能化的迅猛发展,工业机器人在众多行业中的地位愈发重要;RV减速器因其具有体积小、传动精度高等特点而成为工业机器人等行业的重要传动零件。而RV传动的核心传动零件是摆线轮,且其齿廓形状对RV减速器的传动性能十分重要;压力角是评价RV传动特性好坏的重要参考对象,因此以摆线轮齿廓为基础研究压力角的变化规律,对RV减速器的传动性能改善,有着十分重要的价值,本文基于摆线轮齿廓的成形原理以
随着电子封装行业的发展,焊点微型化、密集化的特点,这对焊点的可靠性提出更高的要求。通过机械混合法向Sn-3.0Ag-0.5Cu无铅钎料中添加不同质量分数(0~0.5wt.%)的镀镍多壁碳纳米管(Ni-CNTs),以期改善Sn-Ag-Cu无铅钎料性能。对比研究其润湿性、熔化特性、等温时效中焊点界面IMC层和机械性能变化,得出以下主要结论:1、Ni-CNTs的添加显著改善Sn-3.0Ag-0.5Cu钎
越野环境中的地面无人平台运行条件较城市道路相比地面起伏不定且覆盖物复杂多样,要使地面无人平台能够安全行驶,并准确、可靠的执行各项任务,需要其根据周围环境自主决策规划出一条可靠安全的行驶路径,这就需要探讨兼顾车辆通过效率和安全性的路径规划算法。首先,本文提出一种关于地面无人平台在越野环境运行中最短路径的规划算法。在经典蚁群算法二维网格的基础上,增加地面高度信息,采用三维地图网格创建的方法建立三维规划