论文部分内容阅读
限于键盘的面积,常用的拼音和五笔汉字输入在嵌入式系统受到很大影响,手写体输入是解决这个困难最好的方法之一。但嵌入式系统的硬件资源有限,因此手写体汉字识别应考虑到嵌入式系统的这个特点。其中比较重要的是,嵌入式系统的硬件配置低,除了考虑汉字识别的识别率之外,还须考虑识别时间。弹性网格识别算法能够对汉字进行整体特征的识别,排除了对笔划输入顺序的严格要求,具有较大的优越性,但是在嵌入式系统中却有着识别速度慢、计算时间长的缺点。针对上面的问题,本文研究对弹性网格进行二级分类的算法研究,在保证识别率的前提下减少弹性网格的识别时间。另外,本文还为提高手写体输入的智能化添加了一些功能。
本文主要的研究成果如下:
1.分别对基于笔划数、基于汉字间架结构、基于汉字首末笔划、基于笔段数、基于汉字笔段类别数量编码五种分类器进行了研究,重点在于改善嵌入式系统中弹性网格特征匹配计算的运行速度和识别率,其中实现了基于汉字笔划数、基于笔段数和基于首末笔划数的分类器。在此基础上研究了基于汉字结构的粗分类和各种分类器的集成。
2.研究和实现基于汉字笔段数的分类器的特征提取方法,将笔段数的提取转化为拐点数的提取,提出了三种方法进行了实验:1)求三点坐标切线夹角差值法;2)五点切线平均夹角差值法;3)点到直线最大距离法。并测试了基于笔段数的分类器的识别时间和识别率。
3.实现了嵌入式手写输入系统的联想输入功能和用户关联输入功能,使手写输入系统实用性增强,人性化程度提高。实现了基于弹性网格的数字、字母和汉字的混合识别和在手写输入系统归一化显示功能,为进一步地研究词语、整句输入识别打下基础。
本文的创新之处主要在于:认真研究了笔划和笔段在分类器中的不同作用,从而对现有分类器做了若干改进,包括:1)在现有基于笔划数的分类器基础上提出基于笔段数的分类器;2)在现有基于首末笔段组合的分类器基础上提出基于首末笔划的分类器;3)在现有基于汉字笔划类别数量编码分类器基础上提出基于汉字笔段类别数量编码的分类器。实验结果表明,本文的改进在提高识别性能方面有一定作用。另外,对拐点数的计算的三种方法中,前两种方法也是本文独立提出的。