论文部分内容阅读
人类视觉感知毫无疑问是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和各种干扰噪声的文字识别系统。人类用眼睛和大脑可以识别各种各样的文字和图像,而不计较它的任何干扰和变形。显然,研究机器模仿人类的视觉感知过程不论对汉字识别,乃至图像识别都是具有极其重要意义的。 论文主要涉及了以下工作: 1) 图像预处理。研究了灰度文本图像二值化及字符分割。提出一种灰度文本图像自适应二值化滤波算法。该算法将自适应滤波与局部阈值二值化有机结合起来,较好的克服了噪声对二值化的影响,特别对阴影图像二值化处理具有良好效果。 2) 图像汉字的细化及笔画提取。提出了基于图像形态学的汉字细化算法及基于改进梯度法的汉字笔画提取算法。该算法将汉字笔画归于横竖撇捺四类,并能完整有效的从汉字图像中分别提取出来。 3) 图像汉字的字元制定与编码方法。对汉字的构成进行了研究,在总结多种汉字编码方案优缺点的基础上,结合计算机视觉的特点,提出一种表征汉字特征的机器认知汉字八形码编制方法。 4) 仿人汉字识别系统。在汉字八形码编制及提取算法的基础上,提出了基于汉字八形码的仿人汉字识别系统。 本文研究表明,灰度文本图像二值化滤波算法有效可行;汉字细化及笔画提取算法能够提取出汉字中的横竖撇捺四种笔画;八形汉字识别码能有效的表征汉字的本质特性;基于八形汉字识别码的仿人汉字识别算法能够有效提高系统的抗干扰性和识别正确率。