自然场景图像弯曲文本检测与识别的研究及应用

来源 :兰州大学 | 被引量 : 0次 | 上传用户:sungod123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本作为信息传递的载体,有助于人们对场景语义的理解。而随着移动互联网的发展和人们需求的变化,文本的检测和识别也逐渐从传统的文档文本转向自然场景图像文本。自然场景图像文本的检测与识别可以广泛地应用在实时翻译、票据识别、智能驾驶等多个领域。然而,自然场景图像通常存在背景复杂、文本形态弯曲、模糊等问题,使得文本检测与识别的难度增加。针对以上问题,本文从以下几个方面展开研究:(1)在文本检测方面,本文提出了一种基于可微分二值化的文本检测算法。该方法对可微分二值化网络(Differentiable Binarization Network,DBNet)的主干网络进行改进,使用Res Ne Xt与特征金字塔网络结合作为主干网络,增加了跨通道间的特征融合。利用可变卷积来扩大感受野,可微分二值化函数来自适应阈值,精准定位文本区域,实现对弯曲文本、倾斜文本的准确检测。为了验证本文提出的文本检测算法的有效性和优越性,在弯曲文本、多方向文本、多语言文本等公开数据集上与多个文本检测算法进行对比。研究结果表明,本文提出的文本检测算法从准确率、召回率以及平均得分三个指标上,均取有所提高。(2)在文本识别方面,本文提出一种基于矫正网络的文本识别算法,在ASTER(Attentional Scene Text Recognizer with Flexible Rectification)的基础上加入对偶回归模块。首先,使用对偶回归模块,将原本低分辨模糊的图像进行超分辨率重构;其次,将得到的高分辨率图像传入矫正模块,将弯曲文本矫正成水平形式;最后,利用带有注意力机制的识别模块对矫正图像进行文本信息识别。为了验证本文提出的文本识别算法的有效性,在弯曲文本、含模糊文本等公开数据集上,与多个文本识别算法进行对比。实验结果表明,本文提出的文本识别算法在弯曲文本以及模糊文本数据集中准确率都有所提升。(3)为了实现对弯曲图像进行文本检测和文本识别,本文利用基于可微分二值化的文本检测和基于矫正网络的文本识别算法开发并实现了自然场景图像弯曲文本的检测和识别系统。综上所述,本文围绕自然场景图像弯曲文本检测与识别进行研究,提出了一种文本检测算法和一种识别算法,并构建了可行的弯曲文本检测与识别系统。
其他文献
研究背景及目的:关节疾病导致的软骨缺损是临床治疗难点,组织工程材料为促进软骨缺损修复提供了新手段。具有良好生物功能的镁合金负载可促进BMSCs成软骨分化的淫羊藿苷有利于软骨缺损的修复。本研究旨在设计一种负载并缓释淫羊藿苷的多孔镁合金新型支架,探讨淫羊藿苷/多孔镁合金新型支架修复SD大鼠膝关节软骨缺损的效果及可能机制,为临床治疗软骨缺损提供理论支撑和实验依据。研究方法:(1)细胞层面,将BMSCs在
学位
目的:分析重型颅脑损伤合并多发伤患者入院时的临床特征,建立患者入院72小时内死亡的决策树模型和病情评估的评分系统,探讨决策树模型对患者早期预后的评估价值,为重型颅脑损伤合并多发伤患者的病情评估、治疗决策及早期预后提供参考依据。方法:本研究筛选Dryad数据库中1757例重型颅脑损伤合并多发伤患者入院时的临床资料,将入院3天内死亡患者标记为死亡组(n=619),剩余患者标记为生存组(n=1136)。
学位
现实生活中存在着形形色色的网络,如社交网络、论文引用网络和蛋白质相互作用网络等,人们将这些网络统称为“复杂网络”。复杂网络具有社团结构的特性。社团检测算法旨在高效、准确地从复杂网络中划分出社团结构。社团检测算法有很多类,基于种子扩展社团检测算法就是其中之一。一些基于种子扩展的算法在社团扩展时未考虑社团的聚类特征,其次在社团优化时存在筛选稀疏社团不准确的问题,这两个问题的存在降低了种子扩展算法社团检
学位
目的:探讨输尿管镜下支架管置入术和经皮肾穿刺造瘘术对于治疗上尿路结石引起的尿源性脓毒血症的疗效。方法:回顾性分析广东省粤北人民医院泌尿外二科2017年1月至2021年12月收治的61例上尿路结石引起尿源性脓毒血症患者的临床资料。根据手术方式的不同,将患者分为双J管引流组和肾穿刺造瘘引流组,研究这些病患的术前一般资料:岁数、性别、结石直径、结石位置、术前集合系统分离程度的分度、血清血红蛋白浓度(HG
学位
背景及目的:甲状腺癌是常见的内分泌系统恶性肿瘤之一。由于诊断影像和疾病监测的普及和发展,甲状腺的发病率持续升高,近年女性甲状腺癌发病率位居世界第五;随着发病率的增加和死亡率的降低,如何平衡治疗方法是一个不可避免的问题。本研究旨在证实miR-222-3p及其靶基因在甲状腺癌患者生存预后和免疫浸润中的作用。资料与方法:基于GEO和TCGA数据库,评估miR-222-3p在甲状腺癌和正常甲状腺组织中的差
学位
基于面部表情的抑郁识别近年来受到了广泛的关注,本文从抑郁数据集的采集出发,构建了基于面部表情的抑郁识别模型,实验结果表明了我们构建的抑郁识别模型的有效性。本文的具体研究工作可以总结为以下几个方面:(1)抑郁数据集的构建及预处理为了构建有效的抑郁识别模型,我们招募被试采集并构建了基于面部表情的抑郁视频数据集。数据是在正中负三种刺激下采集的,被试的面部表情变化会被记录下来。我们对数据进行了相应的预处理
学位
背景:脱发是一种常见疾病,特别是雄性激素源性脱发(androgenetic alopecia,AGA),在一定程度上会对患者造成精神和心理压力。患者往往存在自卑等心理压力,给他们的正常生活和社会活动带来了很大的负面影响。目前治疗雄性激素源性脱发的方式有药物、激光、毛发移植和中胚层治疗等。尽管AGA是一种非常普遍的疾病,但目前治疗方法有限。有些治疗方式存在不良反应和部分患者对这些治疗方法不敏感。因此
学位
随着互联网、社交网络等新媒介的发展,大量非结构化数据产生,包括文本、图像、声音等,其中文本占据了很大比例。非结构化文本数据中包含着有价值的信息,面对海量的文本非结构化数据,如何对其利用是信息抽取领域面临的重大挑战。命名实体识别是信息抽取领域的一项关键性基础任务,旨在识别文本中的命名实体,并将其归纳到相应的实体类型中。训练一个实体识别模型需要训练样本,在某些领域,如医疗、电子商务、法律等领域,标注样
学位
目的 观察酒石酸美托洛尔片联合盐酸胺碘酮片治疗心律失常的效果及对炎性因子水平的影响。方法 选取2019年7月—2021年7月抚州市中医医院收治的心律失常患者64例,采用随机摸球法分为观察组和对照组,每组32例。对照组患者给予盐酸胺碘酮片治疗,观察组患者则在对照组基础上加用酒石酸美托洛尔片治疗,2组均连续治疗1个月。比较2组患者治疗效果,治疗前后心功能指标[左室舒张末期容积(LVEDV)、左室收缩末
期刊
研究目的:通过搜集近端锚定区不足行左锁骨下动脉(Left Subclavian Artery,LSA)重建的主动脉弓部疾病患者资料进行总结,对比“烟囱”支架植入术与Castor分支支架植入术两种术式的近期疗效,给后续的临床工作提供一些参考。研究方法:收集2017年11月-2021年3月期间,北京大学深圳医院心血管外科收治的近端锚定区不足的重建LSA的主动脉弓部疾病病例,其中27例接受了Castor
学位