论文部分内容阅读
支持向量机(Support Vector Machine, SVM)作为近年来发展迅速的一种新型的、基于机器学习的一种模式识别算法,具有很好的推广能力,使其应用于多个不同的领域中。目前,SVM分类器的识别技术在信号处理、图像识别和基因图谱识别过程中产生强烈的反响,得到了界内人士的大量好评。由于手写体数字识别属于模式识别领域中的基础的研究课题,因此,SVM分类器在于写体数字识别过程中同样得到了可观的识别结果。本文主要对手写体数字从以下三方面进行了较为详实的研究:预处理、特征提取、分类识别。预处理部分包含了图像的灰度化、滤波去噪、阈值变换以及图像的归一化操作等,通过不同的算法进行对比选择出适应该实验的最佳算法;图像特征提取主要是采用三种不同的方式从图像的不同角度进行了抽取,包括粗网格特征提取、投影特征提取以及轮廓特征提取。在数字的具体识别算法中采用了SVM分类与D-S证据理论相融合的算法进行识别。该方法是在三种不同的特征提取(证据体)的方法之上,利用改进的一对一投票分类原理的一级SVM分类器进行粗分类,同时生成不同类别在不同证据体下相对应的BPA函数;经过改进的D-S证据理论中的组合规则,生成不同证据源与其他证据体之间的冲突度因子,修正原始基本信任度函数,融合多个特征的BPA函数,形成新的信任度函数,作为二级SVM分类器的输入,进行最终的决策识别。实验样本来自阅卷中的手写体数字,统计了大量的0-9的数字。通过C++平台进行编写仿真实验过程表明,本文提出的识别算法能够有效的减少由于单特征识别或SVM识别引起的较大误识率和较低的识别率。同时查阅相关文档,根据本文算法的识别率与BP神经网络、模板匹配、Bayes算法的识别率以及识别所用的时间进行比较,表明该算法在具有相似识别率的情况下能够节约大量的识别时间,同时系统具有一定的容错能和鲁棒性。