论文部分内容阅读
人类在工作生活中经常需要用计算机来处理大量的文字信息,其中一部分是手写汉字,如果能够利用计算机技术快速准确地识别出手写汉字内容,便能大大提高工作效率。除了判断汉字书写的准确性,其书写美感程度也是欣赏手写汉字非常重要的部分。学好汉字、写好汉字是每一个中国孩子学习成长中非常重要的一课。从汉字书写的教学需求及汉字文明的传承需求等多层意义上看,针对手写汉字的美感评价方面开展研究都是非常有必要的。然而目前人工对手写汉字评分的方式具有评价标准不一、工作成本高等缺陷,无法满足用户的需求。本文的目标为探究手写汉字识别与美感评分的有关技术,结合当前最新的深度学习理论思想,构建了一个切实可行的手写汉字识别与美感评分系统,该系统能够更好地辅助汉字书写教学,帮助青少年儿童提高汉字书写质量。论文的主要工作如下:(1)针对本论文的应用场景和模型训练需求,收集整理了新的自然场景下手写汉字图片数据集——小学宝练字作品数据集。该数据集由22,050张自然场景下拍摄的练字作品图片组成,共包含1087个不同的汉字。对于每个手写汉字都标注有它的含义信息和书写美感分数信息。(2)针对本论文对手写汉字美感评分的需求,提出了基于相似度检索策略的手写汉字美感评分方法,根据汉字和美感分数两个条件划分了相似度检索的不同类别,并创新性地将手写汉字深度学习网络提取到的CNN特征与传统的结构特征结合起来,有效地提高了手写汉字的识别与美感评分准确率。(3)针对本论文的工程应用需求,搭建了一个切实可行的手写汉字识别与美感评分系统。该模型主要分为三大部分:手写汉字检测、手写汉字识别、手写汉字美感评分。对于这三部分本文分别构建了适当的深度学习网络模型并基于本文的应用场景进行训练和优化。该系统可以实现的功能为:首先,从一张原始图片中自动检测出汉字的区域并切分成单个字符;其次,针对每一个汉字的区域自动识别出汉字的内容,最后,给出已识别汉字的书写美感评分。本文对系统及各个模块网络进行了性能测试实验,并分析了实验结果,通过实验验证了本文的系统对自然场景下手写汉字的识别与美感评分的有效性。