论文部分内容阅读
字符识别技术作为信息时代重要高新技术之一,已经应用于很多领域,并成为当今模式识别领域中最活跃的内容之一。本文主要研究和实现了对背景图像中的印刷体大写英文字母和数字的自动识别。字符识别技术一般可以分为字符图像预处理、字符特征提取和字符识别三个主要组成部分。本文研究了进行字符识别的关键技术,并针对现实字符存在复杂背景的特点,综合运用了图像处理技术以及混沌和人工神经网络理论,确定了一系列有效的方法对字符进行识别。在字符图像预处理阶段,采用二次全局阈值分割技术,提出了一种能够把图像中字符和背景有效分割的灰度图像二值化方法,解决了字符目标存在背景干扰的问题,得到不错的分割效果。二次阈值算法实现极其简单,两次阈值都采用全局阈值技术自动获取,避免了局部阈值实现速度慢的巨大时间开销,同时克服了单一阈值分割容易出现的错误的把背景当作目标或目标点被错误的归入背景的情况,为字符的准确识别奠定了基础。在字符分割部分,本文利用改进后的水平投影法,将字符图像分割成单个字符,并对分割后的字符进行了归一化处理。字符识别阶段,采用改进的粗网格特征进行特征提取,把归一化字符的原始特征直接输入到BP神经网络分类器中进行字符识别。在分类器的设计中,运用混沌优化算法与BP神经网络梯度下降法相结合的技术,提出了基于混沌优化BP神经网络的图像字符分类识别方法,完成对网络参数的优化设计,有效解决了网络训练时容易陷入局部极小值,收敛速度慢的问题,并通过反复试验和比较选定了适合的网络结构,顺利地进行了字符的识别。在理论研究的基础上,本文采用Matlab对字符识别的相应算法进行了系统建模求解和编程实现。