论文部分内容阅读
目前,我国银行普遍应用电子计算机处理储蓄业务,大量的票据靠手工输入,速度慢,录入人员数量大,劳动强度大。银行票据自动识别系统能够对票据中的数据信息进行识别,由手工录入转化为计算机的自动处理。国内外已经对银行票据自动识别系统作了很多的研究工作,但是,在对储蓄凭条中的手写体处理方面约束性强,而且只能够处理手写体的小写和大写金额,在分割手写体汉字时会出现丢失笔划的情况,还没有能够同时处理不同类别的储蓄凭条的系统。 本文在现有的研究成果的基础上,设计了一种基于先验知识的二值化方法,可以减小二值化处理对手写体笔划的宽度所产生的影响,并且针对于手写体汉字的结构特征,提出了一种新的图象分割方法,该方法解决了手写体汉字笔划丢失的问题,同时,本文还克服了手写体与基线或印刷体文本交叠的局限性,在进行基线去除时,如果手写体与基线交叉,则会出现笔划断开的问题,本文可以对笔划中的裂缝进行弥合处理,而且能够将手写体从印刷体中分离出来,此外,本文通过模板匹配的方法扩大了处理对象的范围,能够将不同类别的储蓄凭条中的手写体填充项提取出来。