论文部分内容阅读
自动阅卷系统因为效率高、易管理、不受主观因素干扰等优点正在逐步替换传统的人工阅卷方式。目前较为普及的阅卷系统一般基于光标阅读技术来实现,需要利用特殊的答题卡与昂贵的专用扫描设备。同时,这种阅卷方式依赖高质量的填涂,不符合考生的答题习惯,容易造成答案错位等问题。为此,本文基于光学字符识别技术实现一款阅卷系统,对该系统中的试卷校正方法、手写体字符提取和识别方法开展研究,提出一系列算法。主要创新工作包括以下三个部分。第一部分,针对试卷的校正问题,提出了基于定位符的试卷图像校正算法。试卷校正是手写体字符提取与识别的重要前置步骤,直接影响到阅卷系统的性能。一般来说,扫描设备获取的图像稳定且噪声轻微,而数码相机面对的情况则复杂多变,获取到的图像会有比较严重的噪声。为此,我们通过检测模板中预先设计的定位符来校正不同来源的试卷图像,由此实现了一款基于定位符的校正算法。实验表明,该算法运行速度快,抗噪性能强,能够稳定且精确地对试卷图像进行校正。第二部分,针对手写体字符的提取和规范化问题,提出了基于灰度直方图的自适应阈值分割算法。该算法通过字符区域的灰度直方图获取一个自适应阈值,由此实现对试卷图像中手写字符的分割。由于分割出的字符图像大小不一,灰度值差异大且包含噪声,我们进一步设计了一款字符规范化方法来得到分类器易于识别的字符图像,提高了字符识别效率。第三部分,针对手写体字符的识别问题,本文提出了基于“混淆感知”的卷积神经网络结构。在图像分类中,需要找到每个图像类别清晰的边界,但是部分图像类别的边界容易混淆。为了解决这一问题,本文提出了一种基于混淆感知的卷积神经网络。在训练阶段,首先训练一个预测分类器,使用交叉验证来估计预测分类器的混淆矩阵,然后基于混淆矩阵建立混淆感知模型,并为容易混淆的图像类别训练一组校正分类器。在分类阶段,预测和校正分类器通过分层结构协同使用,其中混淆感知模型被用作两层分类器之间的连接。在Mnist和CIFAR-10数据集上进行的实验表明,基于混淆感知的卷积神经网络性能优于现有的分类器。基于以上所提出的算法,本文实现的自动阅卷系统能够高精度地识别手写字符。在我们收集到的上千份中小学生的试卷样本上,该系统表现出稳定性与准确性都达到了实际应用标准。