论文部分内容阅读
手写体字符识别是模式识别和图像处理中一个非常重要和活跃的研究领域,在信息处理领域中使用字符识别技术可以大大提高计算机的使用效率,字符自动识别是办公室自动化、新闻出版、机器翻译中最为理想的输入方法。手写体字符识别在很多领域有着广泛的应用前途。到目前为止,尽管人们在脱机手写体字符识别的研究中已取得很多可喜成就,但距实用要求还有一定距离。脱机手写体字符识别因其自身的复杂性,使得系统的实现具有很大的困难,目前还没有十分成熟的产品,是一门待发展的技术。
考虑图像中字符像素的分布特征,设计并实现了基于分布的手写体字符识别算法。在图像分割理论的基础上,确定字符形心,以形心为原点顺时针作等角度区域分割,得到字符区域分布的方向特征。采用偏转校正法对手写体进行偏转校正,可以减少匹配误差。在高精度匹配的原则上,利用最小匹配库,实现字符实时快速匹配。算法在识别率上令人满意(尤其在数字、英文大小写字母识别上),取得了较理想的效果。
本文完成了以下工作:
(1)收集原始的字符图像,扫描成图像数据作为识别系统的输入。
(2)对输入的图像数据进行预处理,包括灰度化、二值化处理,得到字符的二值化图像。
(3)考虑图像中字符像素的分布特征,确定字符形心,以字符形心为原点,建立直角坐标系,等角度36等分字符区域,统计字符像素落在各个区域的像素个数,得到字符特征数组。
(4)利用偏转校正法旋转字符特征数组,获取待识别字符的标准方向特征数组;最后与标准匹配库的方向特征数组作比较,输出最佳匹配结果。
(5)对实验中可能遇到的问题进行了分析和探讨。