论文部分内容阅读
随着互联网的高速发展和手持数码设备的普遍化,网络中的数字图像越来越多,各种应用也随之而来,如图像检索、图像存储与管理等。图像信息给我们带来大量有用信息的同时,也带来了大量的负面的、不良的信息。常见的有色情图像、图像型垃圾邮件和不良图像。这些图像对社会稳定和青少年的健康成长都有很不利的影响。因此对网络中的图像进行管理,将其中的不良信息进行过滤,具有非常重要的意义。网络图像过滤技术分为三类:基于URL封锁的图像过滤、基于关键字的图像过滤和基于内容的图像过滤。基于内容的图像过滤比另外两种方法具有更加广泛的适应性,是比其他过滤方法更有效、适用范围更广的图像过滤方法,也是本文所使用的研究方法。
本文提出一种多分辨率的文本抽取方法,对图像按照固定尺度1.2进行金字塔分解,对每幅分解后的图像,使用16*16的滑动窗口对其进行扫描,提取当前窗口的梯度方向直方图(HOG)特征;然后使用训练好的Adaboost分类器对当前窗口进行分类,并对每幅分解图像中分类结果为文本的区域进行简单的合并;对最终得到的文本区域,利用Canny边缘检测算子和Sobel梯度算子估计文本区域的平均笔画宽度;最后依据笔画宽度与小波滤波尺度的映射关系,选择合适的小波滤波尺度对文本区域进行二值化。
本文在公开数据集ICDAR2003提供的测试集上进行了测试,并随机抽取其中的56幅图像进行结果统计。实验结果显示,本文的文本抽取方法可以达到90.9%的单词级召回率和95.9%的字符级召回率,符合网络图像过滤的需求。本文提出的二值化方法与常用的二值化方法相比,对图像反色、背景复杂、图像退化等情况也都有更好的效果。