基于MSER的文本检测方法研究

来源 :天津师范大学 | 被引量 : 15次 | 上传用户:lwjjet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中不仅含有丰富的图像信息,同时含有大量的文本信息,这是对场景的重要补充,是对场景内容理解的关键线索。随着多媒体技术的发展,数字化视频和图像日益涌现,这给我们带来丰富信息的同时,使得大量图像数据激增。通过自然场景中的文本认知获取场景中的文本信息,有助于理解场景内容,从海量的图像数据中检索、查询、浏览场景图像资料,提高图像资料的管理效率,并且有效节约时间、减少成本,提高信息检索技术的自动化程度。传统的文档图像的文本检测和识别已经日趋成熟,但是自然场景中的文本信息检测和识别却存在较多困难。自然场景图像中文本的文字大小是任意的,排列和对齐方式是未知;光照因素往往对图像中的文本颜色,亮度,对比度等产生影响;拍摄角度的不同,很容易使文本信息产生几何变形,字符断裂等现象,另外由于自然环境的影响,也会降低所拍摄的照片的质量。因此自然场景中的文本检测和识别常常会遇到诸多困难。自然场景中的文本检测是检测图像中是否含有文本信息,并确定文本信息的位置。本文的主要工作如下:将最大极值稳定区域(Maximally Stable Extremal Regions)应用于文字检测。MSER是当使用不同的灰度阈值时,图像所具有的的最稳定的区域,具有仿射不变性。而自然场景中的文本信息与背景具有明显差异,并且具有区域稳定性。利用MSER极好的仿射不变性,将图像中稳定的区域进行提取,并从中筛选出文本区域信息,效果良好。但是存在颜色空间中各异的颜色,转换为灰度值后,却存在近似的现象,导致背景与文本区域的过度融合现象。本文提出将颜色聚类和MSER融合应用于文本检测。先通过MSER确定聚类中心和聚类种类,然后对原始图像进行颜色聚类从而筛选文本区域,从而克服复杂背景进行文本检测和MSER稳定区过度融合的问题。
其他文献
第十五届北京国际艺术博览会即于2012年8月16日至8月20日在北京中国国际贸易中心举行,展场面积1万多平方米,展品包括中西绘画、雕塑艺术及多媒体等。本届艺博会举办了海峡两岸艺术交流展及“当代艺术价值与金融投资策略论坛”,务求促进海峡两岸的艺术文化交流与其进。来自台湾的名典画廊、东门美术馆、涵艺术中心、艺大利艺术中心等十余家画廊及内地的清华大学美术学院、北师大艺术学院、北京石齐美术馆、上海宝艺术、
将结晶器和电磁搅拌器作为一个整体来配置结晶器电磁搅拌技术的基础上,对多个钢种进行在线工业试验。通过铸坯的低倍检验和分析,对其冶金效果进行综合评价;同时相应地对部分