基于多任务级联的场景文本检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fishonscreen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是重要的信息传递载体,能表达高级语义信息,场景文本作为重要的表现形式在生活中大量出现。近年来,在学术界和工业界,场景文本检测已成为理论研究和应用的热点。场景文本检测是OCR的重要环节,被广泛地应用于车牌检测识别、卡证票据检测识别、场景文本情感分析等。由于深度学习的发展,基于深度学习的方法在解决场景文本检测问题中占据主要地位。但场景文本复杂,现有方法仍存在不足,例如尺度变化、种类多样(不同语种和文本类型)、方向任意(多方向、弯曲等)、文本视觉特征杂乱(结构共性少)等。针对以上问题,本文通过分析基于检测和基于分割的场景文本检测方法,建立两种多任务级联的场景文本检测方案。上下文模块与辅助回归的方法主要用于解决多方向文本检测问题。在场景文本特征提取和特征融合方面,主要利用上采样特征融合方法,多分支上下文模块等提取有鉴别力的图像文本特征;在二次检测框架中,该模块有利于提取更好的候选区域;在多任务级联方法上,主要结合坐标对齐的场景文本检测和实例分割的方法,增加基于中心点和角点的辅助回归方法,改进了一般的实例分割分支,提高了多方向文本检测的准确率。特征金字塔融合的场景文本检测方法不仅能用于解决多方向文本问题,也可以用于解决经常存在的弯曲文本问题。它利用更强的特征提取和融合结构,将高层语义信息和低层位置信息有效结合,将特征金字塔各个特征层级上对应尺度的目标有效的提取出来,用于应对场景文本尺度变化的问题,同时使得后续的分类、回归和分割任务能够获得足够的特征。在多任务级联方面,采用一般的实例分割方法能够统一多方向和弯曲文本分割问题,并在模型训练中使用了在线难例挖掘和同步批归一化方法,使得模型收敛效果大大增强。通过实验,对比了两种方案在特征提取上的效果,实验表明方案二有更强的特征融合能力。通过在多方向、多语言和弯曲文本数据集的实验,验证了本文提出的两种多任务级联的场景文本检测方案在多个场景文本检测数据集上达到了当前主流方法的效果。
其他文献
背景既往认为,肌萎缩侧索硬化(amyotrophic lateral sclerosis,ALS)是一种累及上、下运动神经元的慢性进行性神经系统疾病。随着对疾病研究的不断深入,人们发现除运动障碍外,ALS还可合并认知和行为损害。目前,ALS已经成为肌萎缩侧索硬化-额颞叶痴呆谱系疾病(ALS-FTD spectrum disorder)中的一员。ALS患者的认知与行为异常,是加重照料者负担和影响患者
信息技术的发展对学习者获取信息的途径和学习偏好产生影响,如何在网络时代背景下发展学生的核心素养成为重要议题。社会认知双联通教学模式(social-and cognitive connected
本文将传统的微电子片上制备工艺和纳米技术结合,在柔性聚合物衬底上合成横向桥接的ZnO纳米线,制备出大面阵、高均匀性和电学稳定性的柔性紫外焦平面探测器阵列。主要的创新性结果如下:1.在普通光滑的聚酰亚胺(PI)衬底和具有特殊纹理结构的PI衬底上制备基于横向ZnO NW的紫外探测器,对比实验发现普通光滑PI衬底上的传感器在器件制备过程中由于温度、湿度等因素引起残余应力而出现裂缝。这些裂缝较短并随机分布
随着大数据和云计算的飞速发展,传统网络架构日渐僵化,数据平面和控制平面的紧耦合设计导致在网络设备中新增一个功能需要一个漫长的周期。为了改善当前TCP/IP网络架构,软件定义网络(SDN)应用而生。得益于大容量、远距离、低成本等优点,光网络已取代传统传输网络,被广泛应用于现网之中。软件定义光网络(SDON)将光传输网络集成在SDN架构内,以利用光传输的优点。运营商可根据自身业务要求对网络的架构和功能
近年来,由于传感器具有高灵敏性、高选择性、操作简便等优点在众多检测方法中脱颖而出,成为研究的重点。而传感器在食品检测、环境监测、生物分子荧光成像、医疗等领域有着潜
高光谱遥感技术通过数百个光谱窄波段实现地面场景成像,具有较高的光谱分辨率,波段连续且地物识别能力较强。在地质绘图和勘探、大气或植被生态监测、产品质检、精细农业、城
人工神经网络是通过模拟大脑神经系统的组织及机理,进行信息处理的智能模型。得益于其强大的自主学习能力,人工神经网络能够在很大程度上解放人们的劳动力,因此得到大家广泛
酚类化合物(phenolic compounds)是指芳香烃中苯环上的氢原子被羟基取代所生成的化合物,广泛应用于冶金、机械制造、石油化工、化学有机合成工业、塑料、医药、农药等领域。由
随着半导体工艺的快速发展以及技术水平的不断提高,单个芯片上可以集成越来越多的IP核,片上系统(System on Chip,SoC)处理器结构逐渐朝着多核化和异构化的方向发展,基于总线结构的片上系统产生的问题越来越明显。为了更好地满足应用需求、提升系统性能,片上网络(Network on Chip,NoC)应运而生。片上网络是一种新型的片上系统通信架构,借鉴了计算机网络的思想,主要采用了数据路由、
肌电控制假肢通过解码截肢患者残肢的肌电信号,可以实现截肢患者自主控制的目的,但是在实际中,截肢患者使用肌电假肢的比例仍然较低,其中部分原因在于肌电控制的方式不够自然