图像和视频文字检测技术研究

被引量 : 24次 | 上传用户：pilot111

【摘要】

：

图像和视频中的文字是一种包含丰富信息的对象,对于视频内容分析、检索,图片内容理解等研究领域有重要作用。不同于其他典型模式(如单个汉字字符模式、人脸模式等),成行的文

【作者】

：

叶齐祥

【发表日期】

：

2006年01期

【关键词】

：

文字检测文字识别视频内容分析小波特征 SVM分类图像分割

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像和视频中的文字是一种包含丰富信息的对象,对于视频内容分析、检索,图片内容理解等研究领域有重要作用。不同于其他典型模式(如单个汉字字符模式、人脸模式等),成行的文字在大小、灰度、形状、颜色等属性上具有很强的不一致性,在很多情况下文字还处于复杂的背景中,这给文字的检测和识别带来了巨大的困难。而且传统的使用机器学习方法直接检测图像块模式的方法不适合于文字检测问题。因此,本文基于由粗到精的检测思想,提出了适用于几种典型文字((1)视频叠加文字,(2)自然场景图像中的文字,(3)单个数字字符)的一个通用检测框架,在文字检测过程中,我们总是依赖于最可靠的特征进行文字粗定位,然后融合其他特征对候选文字进行验证。这样既提高了检测速度,又能够保证高的检测精度。在三种具体样例上,详细的分析了由粗到精的思想对于文字检测的有效性和重要性。在本文的总结和扩展中,讨论了将由粗到精的检测方法推广到检测图像中的其他纹理对象的可行性。对于视频帧中的叠加文字,作者使用了多尺度的小波特征进行检测。在这个研究中,我们着重研究了如何融合、选择有效的底层特征用于区分文字行和非文字行模式。首先,在文字行的粗定位程序中使用了小波能量特征和全局直方图分析的阈值确定方法检测候选文字象素,然后提出了一种“基于密度”的区域增长方法将离散的像素连接成为候选文字区域。对于检测到的候选文字区域,使用结构特征分割为单个的文字行。在精确分类过程中,融合了三种纹理特征和一种结构特征来表达文字行模式,使用了前向特征选择算法进行了融合特征的筛选。最后,基于选择的纹理特征,使用了支持向量机(SVM)方法分类文字行和非文字行模式。实验表明,算法能够快速,鲁棒的检测视频叠加文字。视频文字的背景往往是复杂的,基于图像灰度信息的OCR软件不能取得好的识别效果。为此,作者提出了一种从复杂背景中分割文字前景的算法。在此方法中,作者基于Canny边缘检测结果提出了一种采样规则,并且使用混合高斯模型(GMMs)对于采样像素在色度-亮度二维特征空间内建立颜色模型,然后使用颜色模型准确地检测所有前景像素。这种先采样后检测的方法,使得文字分割完全自动并且具有很好的效果。对于自然场景图像中的文字,在由粗到精的检测框架内,作者融合了颜色、小波直方图、OCR识别结果统计特征。并且研究了如何从复杂的图像中分割和定位文字行模式和对于发生了仿射形变的文字行进行恢复的方法。在此过程中,对图像分割技术、区域布局分析技术在文字行定位过程中的作用进行了深入的研究。对本文提出的由粗定位到精分类的检测框架进行了深化和验证。对于仿射形变文字行的恢复,利用了平面间的Homography运算,不需要任何摄像机参数。最后,作者研究了一种更为难于检测的文字模式——具有非刚体形变的字符(运动衫号码)。在这种字符的检测中,主要的困难来源于文字的扭曲变形,这种变形是非刚体

其他文献

香蕉重要基因的克隆与功能的初步分析

巴西香蕉(Musa spp.)是一种典型的呼吸跃变型果实,果实采后不耐储藏,对其采后生理学及分子生物学研究已成为研究热点。因此在香蕉中分离与果实成熟相关的基因进而对其进行功

学位

香蕉(Musa spp.)MuMADS1克隆MuBTB1MuArf1RT-PCR

论国家主权原则的现实地位

国家主权是一个历史范畴，在不同的时期人们对其概念和内容有不同的理解。但主流的、传统的国家主权观几乎都论证了主权是一种绝对的、至高无上的、不可分割的、不可转让的权力

学位

国家主权全球化挑战建构

脉络通抗血小板聚集作用的研究

对48例病人随机用脉络通、安慰剂治疗.脉络通组对ADP0.5,1.0μmol/L诱导的血小板聚集率分别由治疗前的67.5±14.1,75.8±9.0降为39.7±12.0,47.8±11.5,脉络通组治疗前后有显

期刊

脉络通安慰剂血小板聚集率

红外光学系统无热化设计方法的研究

无热化设计是利用不同手段消除环境温度变化对光学系统性能的影响。针对红外光学系统,提出一种光学被动式无热化设计方法。从单个透镜出发,列出透镜组的消热差方程组,通过笛

期刊

无热化设计光学被动式无热化设计红外光学系统

利用PVDF传感器检测激光超声的实验研究

简要介绍了激光超声技术以及声表面波的基本特点、激光超声产生和接收的基本原理及激光超声技术的应用。概述了聚偏二氟乙烯(PVDF)压电薄膜材料的结构、性质和应用,以及薄膜

期刊

激光超声声表面波PVDF压电薄膜

高速公路服务区项目的绿色建筑实践

通过对江苏某高速公路服务区项目绿色建筑设计的介绍,探索同类项目在绿色建筑领域内的设计方法和实践经验。主要从绿色生态的室内外环境设计、精细化的资源节约技术、高效的

期刊

高速公路服务区绿色建筑智能化管理

身份犯研究

身份犯理论是刑法理论的一个重要组成部分,本文从身份犯的概念入手,对身份犯的本质、身份犯之身份的界定、身份犯的分类以及身份犯的定性与处罚等问题进行了深入研究。在此基

学位

身份犯刑法身份纯正身份犯不纯正身份犯部分犯罪共同说

中国公益信托法律制度研究

近些年我国经济虽高速发展,但贫困等社会问题并没有完全被解决,如何更广泛地吸收社会资源,以更灵活的方式运用它们来解决这些社会问题,这已是当前中国的一大难题。笔者认为,

学位

信托公益信托信托目的近似原则信托监管

林业有害植物飞机草入侵的生态机理研究

飞机草（Eupatorium odoratum Linn.）为菊科（Compositae）泽兰属（Eupatorium）多年生丛生性草本或亚灌木,是我国重要的林业有害植物,对本地植物、经济林木及生物资源危害日趋严重。本

学位

飞机草林业有害植物生理生态学传播特性入侵

脂微球化前列腺素E1在严重下肢缺血患者中的短期疗效

目的观察脂微球化前列腺素E1(PGE1)在严重下肢动脉缺血患者中的治疗效果。方法回顾性分析本院自2005年7月至2013年3月期间,82例下肢动脉硬化所致严重下肢缺血(CLI)并且无法行

期刊

脂微球化前列腺素E1严重下肢缺血静息痛镇痛药物

图像和视频文字检测技术研究

与本文相关的学术论文