自然场景图像中的文字检测关键算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:adsghah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个信息爆炸的时代,人们获取信息的渠道越来越依赖于基于内容的检索技术。图像通常包含有丰富的信息,而其中的文字信息往往显得尤为重要。从图像中提取文字信息已经成为近年来计算机视觉领域的热门研究课题。作为文字提取技术中的核心前端模块,文字检测技术极其关键。然而由于自然场景中背景的复杂性,文字大小的不确定性,易受光照、遮挡等因素的影响,自然场景图像中的文字检测问题变得非常困难。本文针对自然场景图像中的文字检测算法,从候选文字连通分量提取、中文文字特征设计和字符合并三个方面进行算法的改进。a)在采用最大稳定极值区域作为候选文字连通分量的方法中,为了保证后面进行文字和非文字连通分量分类的正确率,以及减少相应的运算量,在提取连通分量阶段,采用统计特征分析的方法将嵌套结构的最大稳定极值区域去冗余。b)在对中文文字分类进行提取特征时,经过仔细观察汉字的笔画结构特征,通过对连通分量进行骨架化处理,在骨架化的基础上提出了连通分量规则度特征用于文字与非文字连通分量的分类。c)在字符合并时,通过对传统的基于启发式规则的合并方法进行分析研究,提出了基于C4.5决策树的合并方法,该方法通过对样本的训练学习得到相应参数的值,并且学习出更为有效的合并规则。本文在上述几个方面对文字检测算法进行改进。在文字检测常用的数据集上进行的仿真实验表明:本文提出的检测算法在背景较为复杂、光照不均等干扰的图像中取得较为理想的检测效果,显著地提高了自然场景图像中文字检测的准确率和召回率。
其他文献
关于PKB在细胞周期进程中调控作用的研究很少,对受精卵的早期发育调控更很少有报道.该实验研究了PKB在小鼠1-细胞期受精卵中的活性、表达及mRNA水平变化并利用LY294002,PKB的
面对丰富多彩且充满诱惑力的社会生活,世界观不够成熟、价值观尚待形成的青少年学生可能无力应对,这就使他们面临着诸多的心理困惑,承受着沉重的心理压力。近年来,在青少年学
骨髓间充质干细胞(mesenchymal stem cells,MSCs)是具有多向分化潜能的成体干细胞,除了能向多种中胚层组织细胞分化,如骨软骨和脂肪细胞外,还可以诱导分化成非中胚层的细胞组
随着网络中数据业务的急剧增加,传统的以SDH技术为基础的承载网需要向分组交换网络演进,分组传送网技术(PTN)的引入使得传送网技术焕发出新的活力。分组传送网具有IP网络灵活
随着计算机技术的发展,人们开始尝试着用生物特征,如虹膜和指纹来进行人的身份识别。从上个世纪60年代开始,人们开始研究如何基于计算机来实现人类最原始的身份识别模式--通
学位
1.考试简介  医护英语水平考试,即METS(Medical English Test System),考试分护理类(2007年6月首考)和医药类(2012年12月即将首考)。由教育部考试中心、中华医学会、中华护理学会、中国国际人才交流协会联合推出的一项专门用途英语水平考试。2007年教育部考试中心颁布[2007]23号文件,METS(护理类)并于同年6月正式首考。该考试借鉴了国际上先进的语言测试
本文以空间环境中的星载红外成像传感器为研究对象,针对空间环境中典型因素对红外成像传感器成像的影响,开展对红外成像传感器成像质量的仿真研究。这些典型因素包括两部分:
在诸多与曲面共形的微带天线中,圆柱结构的共形微带天线是最为常见的情况,相应的也受到了最广泛的关注,因此有必要对其进行精确的分析。一些数值方法(矩量法、有限元法或有限
分析猪群体遗传结构和遗传变异,是保护和利用猪品种资源的基础,也是杂交改良的前提.该研究利用18个微卫星位点,分析了8个不同品种猪群体的遗传结构、遗传变异.其位点平均多态
在太赫兹(THz)波段应用半导体材料作为表面增强拉曼散射(SERS)基底可以获得很大的SERS增强因子,而大的增强因子有着极好的应用前景。本文应用FDTD Solutions软件对三种不同形貌的半导体材料In As双微纳量级的粒子结构模型进行了模拟,在THz波的激发光照射下,其SERS增强因子可达到1011数量级。本文主要包括以下内容:THz波和拉曼光谱简介,THz目前国内应用较少,但是有很大的应