论文部分内容阅读
手写体汉字识别在邮件分拣、办公自动化和智能录入等方面有着广泛的应用前景。然而,由于汉字笔画相比其他常见的字符如英文字母和阿拉伯数字更加复杂,又因个人书写风格和习惯不同,所以汉字的种类变得格外繁多,这也使得手写体汉字识别更加困难。因此手写体汉字识别一直是研究热点也是难点。本文以脱机手写体汉字的单个汉字为研究对象,根据脱机手写体汉字识别目前存在的问题及其特定领域知识和卷积神经网络的特性展开研究,主要工作如下:1.针对脱机手写汉字因个人书写风格和习惯的不同而产生笔画扭曲形变的问题,引入了一种新的反向合成空间变换网络,将其与卷积神经网络结合,提出一种新型手写体汉字识别框架。反向合成空间变换网络基于反向合成图像对齐算法来对输入的图片学习,得到了对应的单应性变换矩阵中的参数。因此它可以对各种书写风格和产生形变笔画的手写汉字进行对齐、纠正。本文通过TensorFlow深度学习框架在CASIA-HWDB数据库上对所提出的网络框架进行了仿真实现,仿真结果验证了反向合成空间变换网络对手写汉字的纠正效果,并表明整个网络框架在识别性能上有所提升。2.卷积神经网络对图像的识别和分类有显著的效果,因此本文对卷积神经网络的结构及优化进行了大量实验研究,其中包括卷积神经网络的网络深度、学习率的设置、正则化技术(L2正则化和Dropout技术)以及BN层等优化算法。虽然卷积神经网络有较强的学习特征的能力,但是卷积神经网络像一个黑盒子,忽略了一些本身不能习得却是特定领域的有效先验信息。于是文中利用传统的特征提取算法Gabor和Sobel来提取数据样本的八方向特征作为一种先验知识,并将提取的八方向特征图与原数据样本融合作为本文优化的卷积神经网络的输入。同时八方向特征图与原数据集融合在一定程度上扩充了训练数据集,并有助于解决无约束数据样本不足的问题。最后仿真结果表明传统算法结合卷积神经网络能够进一步的提高脱机手写体汉字分类正确率。