论文部分内容阅读
OCR技术的发展,催生了海量的文本图像处理需求。而除了专业的特殊应用,文本图像往往是通过拍照的方式获取的,拍照过程中难免导致图像非均衡光照。在对文本图像进行识别之前,需要先采用光照均衡算法消除光照不均衡现象。现有的常用的光照均衡化方法有直方图修正、同态滤波、Retinex增强和形态学算法等,在针对文本图像光照均衡化方面,或多或少存在一些不足之处。论文详述了一种基于top-hat变化的形态学算法,用于提取文本图像的非均衡光照背景,获得光照均衡化文本图像。该算法涉及多方向结构元素形态学、形态学开闭重建技术、top-hat变换、基于熵的图像融合、形态学对比度增强等技术手段。算法包括如下过程:为防止在图像处理过程中块状效应和伪轮廓的产生,使用开重建技术代替开运算,对top-hat变换进行重新定义;增加闭重建运算操作,解决―过去光照‖效应;定义多方向结构元素,以尽量匹配文本信息中不同方向的图像特征,得到多幅含有方向信息的子图;基于子图的熵值,对子图进行加权融合;采用简单的形态学对比度增强算法,对图片进行对比度增强操作。文章将提出的算法和其他几种常见的算法应用于合成的不同光照模式图片和真实采集到的不同文字纹理图片,将获得的结果进行对比,验证算法的有效性和普适性。最后,完成基于形态学的文本图像光照均衡化算法的硬件实现,给出系统框架和各功能模块的结构框图以及相关仿真时序图,并利用FPGA验证平台对算法的硬件实现进行功能验证,以及设计面向光照均衡化图像处理的VLSI版图。