论文部分内容阅读
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向.研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程.因此,研究模式识别,是理解人类智能的本质的重要途径.字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题.手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标.在这种大类别识别的研究中,传统上大多采用匹配的方法来解决问题.原因是方法的实现比较简单.但是,基于匹配的方法分类精度比较低.近年来,对人工神经网络的研究表明,神经网络是一个高度并行的,非线性的,具有很高冗余度的系统,同时,神经网络所具有的自学习自组织能力,是我们能在与外部世界的交互作用下,实现无法用传统的计算理论表达清楚的功能.所有这些,使得人工神经网络作为一种认知模型在模式识别中得到了成功的应用.更重要的一点是,网络的学习机制为综合集成中倡导的人机集成的实现提供了有利的工具.本文主要研究了手写字符识别.重点在利用人工神经网络手写数字识别的预处理阶段,并对倾斜的数字图像提出了一种新的校正方法,这种方法既易于理解又简单易行.传统的校正方法,都是在首先估算出数字图像的大概的倾斜角度,然后再根据这个角度进行倾斜校正.但是估算出的倾斜角度往往误差较大,这对于传统的用于模板匹配或是用力矩来识别的识别算法影响不是很大.可对于利用神经网络来识别手写数字来说,如果用来训练神经网络的特征向量是从校正的图像中得到的,而待识别的手写数字却是未经校正或是校正误差比较大的,那么一定会造成很低的识别率;如果用来训练神经网络的特征向量和用来识别的特征向量都是从未经校正或是校正不完全的手写数字图像中提取出来的,那么识别率会更低.因为系统不会知道数字是往哪个方向倾斜,倾斜多少度.在将倾斜的数字图像校正以后,就可以从所有的数字图像中取出一部分来进行神经网络训练,另一部分来进行识别验证.