自然场景图片中的文字检测技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:yaoyao1021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机和互联网的发展,自然场景图片的获取和分享更加简单快捷。场景图片中的文字蕴含丰富精确的信息,图片中文字信息的检测对于图片内容的理解具有重要的意义,同时,图片中的文字可能是用户关注的焦点。自然场景图片中的文字检测指的是判断图片中是否包含文字,若包含则将文字区域与背景进行分割,利于后续的文字识别、翻译、语音播报等处理。自然场景图片中的文字检测存在背景复杂、文字表现形式多样和图片质量不佳等挑战。传统的基于连通域的检测算法一般由候选字符提取过滤、文本行连接、文本行过滤这几个步骤组成。该类检测技术存在以下问题:候选字符过滤环节难以区分砖块、圆圈等与字符相似的噪声区域;真实字符被滤除造成文本行检测不准确;由于不存在文本行的约束,难以检测单独出现或成对出现的字符;未考虑多方向文本行检测的不同点。因此,本文提出了基于级联过滤和连接的场景文字检测方法,同时对多方向文本行的检测进行拓展。本文的具体工作如下:1)融合基于特征过滤的ER算法和基于宽高比约束的MSER算法进行候选字符的检测。在文本行连接环节提出基于距离和相似度的衡量准则进行字符对的连接。加入单双字符检测模块和基于文本行内字符相似度和文本行统计特性的候选文本行过滤模块。该方法弥补了文本行内部字符缺失造成的检测误差,同时对噪声区域具有较好的滤除效果。在ICDAR2011和ICDAR2013数据集上进行实验,结果表明该方法能提高文字检测的精度和召回率。2)对多方向的文字检测进行拓展。分析了多方向文字检测与水平方向文字检测的异同点,改进了文本行连接算法。采用字符矩形框中心点作为文本行连接的特征,同时采用字符矩形框和文本行矩形框旋转的方法进行多方向文本行的检测。在USTB-SVT数据集上进行实验,结果表明该方法可以有效地检测多方向的文本行。
其他文献
井筒发生出水涌砂灾害,将严重威胁整个矿井安全。以近年来我国发生的典型井筒水砂灾害为背景,系统分析了井筒发生水砂灾害的原因、影响因素、过程及危害,提出了井筒水砂灾害
纵观近几年我国公路上修建的高等级的大、中桥梁发现,几乎都采用先简支后连续结构体系。文章阐述了先简支后连续结构体系在实际工程中的优点和施工工艺要点,探讨了施工过程中采
为了探索西部边坡生物防护模式,将厚层基材(TBS)工艺引入到云南功果桥水电站边坡生物防护治理工程中,以此实例介绍了TBS工艺流程及边坡防护植物的选择,对绿化后的植被生长情况
为筛选有效防治链球菌感染的药物,试验研究了麝香草酚对猪链球菌2型(SS2)感染小鼠的抗炎作用:用猪链球菌2型CCVC606菌株亚致死剂量感染小鼠,连续3 d腹腔注射麝香草酚水溶液,
在对田径运动会涉及的各种信息流进行深入分析和研究的基础上,采用结构化方法开发了一个既适合于专业化又适合于群众性田径运动会的管理信息系统(TFSMIS),提出了在Client/Server(
目的探讨检测乙型肝炎病毒表面大蛋白(LHBs)用于反映HBsAg阳性患者体内乙型肝炎病毒复制的临床意义。方法采用酶联免疫吸附实验(ELISA)和荧光定量PCR法对1066例HBsAg阳性血清标本
针对三相四线制低压配电网中存在的谐波污染严重、中性线电流较大的问题,提出了一种基于无谐波检测的三相四线制有源电力滤波器(Active Power Filter,简称APF)控制策略。建立了
教师的评价制度一直以来都是学校管理制度的重要一环。针对中职学校生源差,师生比不足,教师工作量大,绩效考核制度无法调动教师工作积极性等实际问题,笔者尝试打破过去以扣罚
牛仔服伴随着改革开放向西方学习的思潮而来,唐装则复兴于繁荣的新世纪之初,本文以"牛仔服"和"唐装"的流行为研究对象,通过探寻其流行原因,来揭示服饰时尚中的文化变迁,并由
分析了双离合器式自动变速器中干式和湿式离合器的特点,着重对影响千式双离合器性能和寿命的因素进行了分析,其中滑摩导致的温升是影响的关键。建立了双离合器式自动变速汽车起