基于改进卷积神经网络的文本检测技术研究

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:ruguofengdiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检测是一项在图像中定位到文本区域的技术,在智慧旅游、无人驾驶等各项任务中应用广泛,在智能化社会中的方方面面发挥着无可替代的作用。传统的文本检测技术具有检测准确率低,适用面狭窄,鲁棒性较弱,依赖于人为手工引导等缺陷。深度神经网络通过大量数据的训练,可得到泛化能力和鲁棒性较强的检测模型。在文本检测领域中,在卷积神经网络中引入空洞卷积的形式作为基础网络能够有效增大感受野,且可以进一步增强特征提取能力。因此利用改进卷积神经网络技术的文本检测方法是当前重要研究方向之一。自然场景中的文本检测,尤其是自然场景中的中文艺术字的检测,是文本检测研究领域中的一个难点。在中文草书文本存在连笔现象,以及自然场景中文本形状和大小极度不规则且方向多变等特点,都给文本检测技术带来了极大的挑战。目前,虽然基于卷积神经网络的文本检测方法虽取得了一定的成绩,但在解决草书连笔字的检测和自然场景下任意形状文本检测任务中仍存在一些问题未得到有效解决。为解决上述问题,本文克服了当前草书文本检测数据集缺乏的困难,构建了草书检测数据集,并提出了一个基于自建数据集的草书文本检测方法。针对当前自然场景文本检测存在的不足,本文还提出一种改进的任意形状文本检测方法。本文主要研究内容如下:一、针对当前文本检测领域中缺乏草书文本检测识别数据集的问题,本文设计构造了一套草书数据集(Chinese Cursive Dataset,CCD)。该数据集中包括约两万个字符,并且包含了各种真实草书可能出现的特点,例如连笔、字体不规则、方向多变等情况。在草书数据集上进行了多组对比实验,验证了本文提出数据集的研究意义与价值。二、在对中华草书字符的单字检测中,提出了一种基于自建草书数据集的文本检测方法(CCD_based on cursive detection method,CCD_cdm)。为了实现中华草书字符的单字检测,利用vgg-16作为基础网络用于提取特征,并且融入注意力机制模块进一步增强基础网络的特征提取能力。另一方面,对于草书字符存在连笔的特点,采用片段链接的方法。具体地,当检测到字符的一部分区域之后,再逐渐检测到相比之前更多的文本区域,通过链接以判断检测到的区域是否为文本区域,最终得到草书文本单字符区域。三、在自然场景下对任意形状文本检测任务中,改进并提出了一种自然场景下的任意形状文本检测方法(Squeeze Dilated Network,SDNet)。该方法针对残差网络未从特征通道角度进行加权的问题,引入一种注意力机制有效挖掘网络在特征通道上进行加权操作,以增强特征提取能力。除此之外,本文在基础网络中引入空洞卷积,在不改变网络模型的参数量的前提下,提升了基础网络的感受野,并且在模型的后处理中融入了Jaccard系数以适应自然场景下文本仅占图像区域较小部分的稀疏文本图像,提升了任意形状下文本检测的准确性。本文进行了多组对比实验,并与目前主流的文本检测方法进行了对比,均取得了较佳的实验的效果,从而验证了本文所改进提出方法的有效性。
其他文献
碳纤维织物增强砂浆(Carbon Textile reinforced mortar,简称CTRM)是一种由碳纤维织物和高性能砂浆复合形成的材料,具有高强、轻质、高耐久性的特点,因而该材料的工程应用前景广阔。目前该材料基于温度影响的力学性能研究尚处于起步阶段,对该方面进行深入的研究不但可以获得相关的理论,还有助于该材料的推广应用。本文通过单轴拉伸试验研究了温度、升温路径、基体内钢纤维以及织物上预拉
目的:观察针刺联合塞来昔布胶囊治疗OVCF患者PKP术后残余腰背痛的临床疗效。方法:选取2019年01月至2019年12月期间在厦门市中医院骨伤科被确诊为骨质疏松性椎体压缩性骨折,并顺利行PKP术,术后仍存在腰背痛的患者60例,随机分为对照组和试验组各30例。对照组予口服塞来昔布胶囊,试验组在对照组的基础上,加以针刺相关穴位治疗,1周为1个疗程,两组均治疗2个疗程。对治疗前后两组患者的VAS疼痛评
党的十九大报告指出,要“推进国际传播能力建设,讲好中国故事,展现真实、立体、全面的中国,提高国家文化软实力”,党和中央不断强调“文化走出去”战略,强调需努力讲好中国故事、做好对外文化传播以及文化贸易。文化日益成为中国在国际舞台上争取话语权,树立国家形象的重要载体。在“文化走出去”战略的指导下,各大城市展开了文化对外传播的尝试,“南京周”活动就是南京市委市政府在推动南京“走出去”的一次实践。经过5年
目的:自身免疫性卵巢早衰(Autoimmune premature ovarian failure)发病率的增加逐渐引起人们的关注,但其复杂的病因导致目前尚无有效的治疗方案。尤其对于年轻未育的卵巢早衰患者来说,恢复生育能力是最迫切的愿望,虽然目前的激素替代治疗(hormone replacement therapy,HRT)可以缓解临床症状、保持“年轻”状态,但不能恢复生育能力。随着医疗科学的发展
目的:观察走罐疗法对原发性骨质疏松症患者腰背痛程度的改善情况及对其生活质量的影响。方法:根据入组标准及排除标准收集原发性骨质疏松症患者共68例,均签署知情同意书。将患者随机分为对照组和试验组各34例,对照组采用药物治疗(碳酸钙D3片+阿仑膦酸钠维D3片),试验组在对照组基础上使用走罐治疗,每周治疗2次,共治疗4周。分别于干预0周、1周、2周、4周时记录两组患者的NRS评分,在干预0周、4周时测定两
克运集运集团成立于1993年,经过多年的经营和发展,目前已发展成为具有多项国家级行业许可和国际专业资质认证的大型专业化综合物流集团,主要从事国际进出口货物运输及物流延
会议
多目标问题普遍存在于实际生产问题的各个环节中,选择合适的求解方法是研究并求解该类问题的关键。求解该类问题最终所得的是一组Pareto最优解集,因此多目标优化问题及其求解
目的:外源性MSCs向靶组织的低归巢率是影响MSCs治疗效果的一个关键障碍。本论文旨在研究调控MB-e MSCs迁移归巢的机制,为进一步探索促进MB-e MSCs向受损卵巢迁移、归巢的有效途径,从而增强MB-e MSCs对POF的治疗效果提供理论基础。方法:通过Western blotting检测MB-e MSCs表面CXCR4受体表达,采用RNA干扰(RNAi)技术构建sh RNA干扰载体敲降M
轮毂轴承法兰是第三代轮毂轴承单元配合防抱刹系统的关键部分,其螺纹孔及外观检测有严格要求。传统的人工检测方式检测精度低、速度慢、耗费成本高,无法满足现在的检测要求。随着机器视觉技术的不断发展,因其检测精度高、速度快等优点在工业检测系统方面应用越来越广泛。本课题针对目前存在的弊端,结合行业标准,提出了一种基于机器视觉的轮毂轴承法兰检测系统,主要研究如下:(1)采用光电传感器触发相机采集图像的方式设计了
图像中的文本提供了丰富而精确的高级语义信息,对于场景理解、图像和视频检索等众多潜在应用具有重要意义。文本检测作为理解场景文本的必要手段,近年来受到了计算机视觉领域的广泛关注。然而,由于文本尺度的多样性以及图像质量的不确定性,自然场景中的文本检测仍然是一个具有挑战性的问题。受启发于卷积神经网络在目标检测任务中的成功应用,本文结合深度学习技术,提出了一种基于多级特征提取的文本检测方法。该方法设计的多级