基于深度学习的自然场景文本检测研究

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:qtjqty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机、数码相机等科技产品广泛进入到人们的生活中,图像信息成为我们日常生活中获取信息的主要方式之一,而图像中的文本内容尤其成为人们感知图像信息的关键来源,所以越来越多的研究人员关注于基于内容的图像分析。从自然图像中有效获取文本信息对于图像内容的分类、理解、存储起着举足轻重的作用,自然图像的文本检测技术具有重要的研究意义和价值。近年来,人工智能技术得到了长远的发展,应用领域也变得十分广泛,尤其是在基于图像的目标检测领域方面。以深度学习为核心的目标检测技术通过卷积神经网络(Convolutional Neural Networks,CNN)提取图像中的特征图,采用后处理模块对图像进行分类,不需要人为设定参数,通过数据集即得到相应的模型,能够十分高效的检测目标。本文研究了基于深度学习的自然场景图像文本检测方法,主要研究工作如下:1.本文首先研究了文本检测领域中的主流检测算法和技术,详细分析了一些经典的国内外文本检测算法,包括基于传统算法的文本检测算法和基于深度学习的文本检测算法,并且在分析这些算法的优缺点的基础上,确定以EAST算法为主要对象深入研究自然场景文本检测的优化方法。2.考虑到文本上下文具有很强的关联性,本文提出了ICBPE-EAST算法。该算法通过对融合特征进行序列化处理得到序列特征,将序列特征输入到BLSTM网络中去,形成文本上、下文信息的前后循环,改善EAST算法存在的网络参数的收敛曲线波动较大、影响收敛性能的问题。此外,该算法在进行长文本检测时,当检测区域的相邻区域为字符区域时,根据文本的关联性判断检测区域为文本行的概率增加,从而提高了算法对长文本的检测能力。仿真对比结果表明,ICBPE-EAST算法相比于传统的EAST算法,在精确度提高了1.50%,召回率提高了3.57%,F值提高了3.44%。3.为了更准确地检测出长文本行、合并文本框,避免出现检测框重叠的情况,本文从另外角度来改善ICBPE-EAST算法,提出了IFPP-EAST算法。该算法首先利用Res Net特征提取网络取代原EAST算法中PVANet网络,不仅简化了结构,而且能提取更完整的特征信息。其次对叠加空间金字塔池(Atrous Spatial Pyramid Pooling,ASPP)模块进行了改进,构造了FPN和改进ASPP模块相结合的编码-解码器结构,提高网络的感受野,以达到精准分割的效果。最后还对检测框合并过程进行了改进,使得改进后的算法可以更准确的合并文本框,同时对长文本的检测有一定的改善作用。仿真对比结果表明,IFPP-EAST算法在长文本检测和文本框定位精度有改善的效果。
其他文献
可转换公司债券(简称“可转债”)与普通公司债券不同,这是一种内嵌期权价值的债券。对于投资者来说,这种投资工具兼备债权性质和股权性质,债券部分为投资者提供了保底收益,股权性质为投资者提供了一个看涨期权,使投资者获得超额收益成为可能。随着再融资新规的出台,越来越多的上市公司选择通过可转债进行融资,其市场规模不断扩大。而国内学者对可转债的研究多局限于定价方面,缺乏对交易策略的研究。由于投资者对可转债市场
自比特币诞生以来,“币圈”热度有增无减。近期,随着“狗狗币”“柴犬币”等名人加持的虚拟货币红遍全球,“炒币”之声遍布街头巷尾,在很多人看来,借“炒币”获取巨大财富,似乎并非
报纸
运用文献资料法和逻辑分析法,借鉴马兹曼尼安-萨巴蒂尔政策执行模型,对我国体教融合政策在执行过程中潜在的制约因素进行分析。体教融合政策执行是一项涉及多部门、多领域的
目的:系统评价中医药治疗卵巢功能下降(decreased ovarian reserve,DOR)与卵巢早衰(Premature Ovarian Failure,POF)的有效性。方法:利用计算机检索中国生物医学文献(CBM)数据库、中国知网(CNKI)、维普中文科技期刊全文数据库(VIP)数据库、Cochrane Library数据库、Pub Med数据库、Embase数据库检索时间从各数据库建
我们正处于一个快速进步的时代,同行间的角逐逐渐白热化,这样的大环境为企业的生存与发展提出了更加严苛的要求,而为了适应当前的市场,创新便成了企业能够长久生存下去的前提条件。只有不断创新,企业才能在这竞争日益激烈的市场中生存下来。高科技行业是当前进行创新的一大重要载体,而医药制造业又是高科技行业的典型代表之一,也是社会关注的一大焦点。21世纪后,医药制造业的动态受到了全世界的关心,特别是近几年,人口的
新课改背景下,提升小学语文写作水平既是语文教学难点,也是教学创新的主要目标之一。分层教学模式是基于最近发展区、建构主义学习理论上形成的一种教学模式,该教学模式可以
目前,中西药复方制剂在我国的使用比较普遍,但是由于其成分较为复杂,使用的过程中也出现了一些问题。近年来,国家食品药品监督管理总局不断发布关于中西药复方制剂的不良反应
电网向着远距离、大容量、特高压、高智能方向快速发展,变电站接地网面积和故障电流也不断增大,由此引起的安全事故也时有发生。而由短路或雷击故障引起的地电位升高和电势差给发电厂、变电站内工作人员和设备的安全造成一定的威胁,因此对新建或运行中的发电厂、变电站接地系统安全性能的评估是变电站接地系统设计、建设和运行维护整个过程中不可或缺的部分。本文主要在变电站接地系统传统特性参数阈值比较评估方法的基础上,以人
综合智慧能源作为能源互联网产业发展的重要业态,已成为促进可再生能源利用、提高能源系统能效与降低用能成本的重要抓手。但当前综合智慧能源概念边界模糊,且具有多元主体博
我国城市化过程中交通需求和城市空间能力之间的冲突日益严峻,作为解决这一问题的有效方法,各大城市积极发展城市轨道交通网络。轨道交通建设是当前我国大中城市中的热点问题