论文部分内容阅读
离线手写汉字识别中,字符的正确切分是实现传统OCR(OpticalCharacterReading)技术可用性的基本因素。然而,对于自由手写汉字字符串,在识别之前无法可靠地对字符实施分割,主要困难来源于字符大小、间距的变化和相邻字符之间的粘连。找到所有的候选切分位置是成功分割的前提。根据候选切分位置构造候选字符模式,由候选字符模式识别结果的有效性可以做出切分决策,其中需要将字符分类结果和语言知识合并到分割中。利用语言知识的策略以及分割与分类的实施,均依赖于特定的应用背景,语言知识可以用于候选字符识别或识别假设的后处理。
对于存在字符间粘连的手写体汉字串,在图像上精确定位包含所有分割位置的候选切分位置集是很困难的。然而,汉字是由简单笔划按照特定的关系构成的,粘连汉字的分割点在笔划结构上通常是清晰的。
本文提出了一种基于笔划结构图的手写体汉字切分与识别方法。通过提取汉字的笔划结构并以图的方式予以表达,将汉字的切分与识别转换为图的分割和识别,运用图论进行汉字的切分。对于由多个连通部件构成或者发生内部断裂的汉字,可以通过笔划结构子图的合并构成候选的字符模式;而彼此粘连汉字的切分就是相应图的分割。采用基于骨骼的笔划提取方法,提取汉字的笔划结构;从笔划结构图上直接计算笔划方向特征,采用特征值误差补偿和非对称分布模型对候选字符模式进行分类;针对特定的应用背景,采用词典驱动的切分与识别策略。
基于骨骼图像的笔划提取取决于特征点的提取,特征点集合的完整性是提取正确笔划结构的前提。
预分割是基于子图合并的切分与识别策略的基础。预分割并非一定要求提取单个完整的字符,如果在词图上存在一条从源点到终点的路径,该路径上的边构成相应的字符序列,则预分割的结果就使得正确分割成为可能。
笔迹重构是从字符的静态图像中提取笔迹顺序信息,有助于将在线识别方法应用于离线识别问题,以及实现单个手写字符识别和字符序列识别方法的统一。
在已经提取笔划结构的情况下,当然可以采用结构匹配的方法进行汉字识别。然而,基于降低技术难度和提高稳定性的考虑,本文采用了统计模式识别理论与方法进行汉字识别,直接从笔划结构上计算笔划方向特征,综合利用了汉字笔划结构稳定和统计方法抗噪声干扰的优点。
马氏距离是在多变量正态分布概率密度函数的假设下推导出来的,然而,汉字字符样本的分布与正态分布假设有明显的差异。当可以利用的样本数量有限时,主向量分析(PrincipalComponentAnalysis)计算的特征值通常包含误差。因此,需要采用改进的马氏距离来计算未知模式的特征矢量与某类的均值矢量之间的距离。
词典驱动的方式在英文单词识别中已有广泛的应用。汉字类别繁多,采用词典驱动的方法进行词语识别,是针对特定应用背景的一种有效的解决方案。
本文对上述问题进行了深入研究,主要创新体现在以下方面:1.采用基于识别的手写体汉字切分策略,并将其转换为相应图的分割。2.基于骨骼的特征点直接提取方法,保证笔划提取的可靠性,并基于笔划结构直接计算笔划方向特征。3.基于图分割的汉字切分方法,字符切分就是相应笔划结构图的分割。4.基于笔段关系图的笔迹恢复技术,笔迹重构实质上就是笔段的排序问题。5.基于次特征值误差补偿和优势主向量上非对称分布的马氏距离改进算法。6.基于词典驱动的识别策略,搜索时遍历词图,选择对应于词典中有效词语的最小代价路径,减小了搜索过程的复杂性。