论文部分内容阅读
随着联机手写识别精度的不断提高,识别算法的复杂度也随之上升。然而,就算是目前识别性能最好的卷积神经网络模型,在识别某些用户的手写文字时也有可能只有60%左右的平均首选识别率。由于已有模型的复杂性,很难通过实时在线训练的方式让识别引擎快速适应这类用户的书写习惯,从而大幅提升针对他们的识别性能。为了解决这一问题,必须寻找一种全新的识别模型与方法,该方法既能够对书写人的不同书写特点进行实时、增量自适应,同时其计算复杂度又要足够的低,以便算法能够运行于智能移动设备客户端上,这就对联机手写识别提出了一个全新的挑战,而这方面目前还缺乏系统研究。针对上述任务,本文提出了一种将手写文字按特定的切分规则切分成基本的、语言无关的自然笔画序列,然后将该序列转化成字符串序列来进行手写字符识别的方法。本文的方法主要包括三个部分:首先,为了获得稳定的自然笔画序列,对所采集到的联机手写文字进行预处理,设计实现了稳定的笔段提取的规则和基于向量游走的笔段切分方法。然后,针对自然笔画的特征,本文对自然笔画的类型进行了扩充,并实现了自然笔画类型的识别,将手写文字的自然笔画序列转换成了与类型相对应的字符串序列。在此基础上,本文引入了字符串匹配的最小编辑距离的方法对字符串序列进行匹配与识别。为了进一步提升识别性能,我们提出并实现了笔画的模糊尺度提取模型以及基于该模型的识别候选的重排序方法。为了对序列化方法的可行性进行验证,本文将公共数据集HIT-OR3C分为训练和测试部分,对所提出的手写文字序列化和识别方法进行书写人相关和书写人无关的识别性能测试。实验结果表明,在对手写文字进行序列化后,采用最小编辑距离序列匹配方法对于手写人无关识别能分别获得55.85%和89.58%的首选和10选正确率,而在每个字只使用同一书写人的两套训练样本后,书写人相关的首选和10选正确率分别为65.92%和91.90%。而通过引入基于笔画模糊尺度的候选结果重排序方法,本文的书写人相关首选和前10选正确率大为提升,分别达到了79.87%和94.26%。由于与传统方法相比,本文方法可以有效地减少训练时间,而且可以实时地将用户书写样本加入已有模型,因此这一实验结果证明了本文方法在手写文字实时增量学习和用户自适应上的良好应用潜力。