论文部分内容阅读
在过去的40年里,人类阅读的机器仿真是很重要的研究方向。由于阿拉伯文字的复杂性,对阿拉伯文字自动识别的研究很少见。随着拉丁文、中文和日文在光学文本识别上的成功,光学识别阿拉伯文也重新得以大量研究。到目前为止,虽然有些这方面研究的报告,但还需要大量深入的研究。
在本文中,提出了一套用于阿拉伯文字结构和几何特征的提取方法。本系统重点运用了支持向量机(Support Vector Machines)作为模式识别的工具。假设每个阿拉伯字符的字形都是独立的类而忽略分割字符的特征。本系统主要分为三部分。第一部分是预处理,进行字符图像二值化,线性分割和单词分割。分割后的单词输入到第二部分--特征提取。提取的特征包括20个纵向滑动窗口特性的总和,纵向投影点密度的4个极大值和4个极小值,字符重心,连接部分的个数,角和重点的位置以及字符影像的平均值。最后一部分是分类,采用了具有一对多功能的多级支持向量机。
最后还针对打印和手写阿拉伯字符对上述的识别系统进行评估。打印字符选用Andalus,Arial,Simplified Arabic,Tahoma和Traditional Arabic等五个字体,进行了四组实验。第一组实验分别用三个具有42个特性的数据集进行所用字体的检测,识别率分别为97.344%,88.727%和88.582%。与之对应,第二组实验对所有字体的单组特性进行检测,每组不同特性识别率分别为95.287%,90.446%和80.690%。第三组实验用15组不同的数据集对不同字体的不同组特性进行检测,识别率均在97%以上且最高识别率为98.743%。第四组实验用手写字符数据集对手写字符进行检测,识别率为94.884%。