阅卷系统中手写体字符的提取与识别

来源 :苏州大学 | 被引量 : 2次 | 上传用户:chaowei7838
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动阅卷系统因为效率高、易管理、不受主观因素干扰等优点正在逐步替换传统的人工阅卷方式。目前较为普及的阅卷系统一般基于光标阅读技术来实现,需要利用特殊的答题卡与昂贵的专用扫描设备。同时,这种阅卷方式依赖高质量的填涂,不符合考生的答题习惯,容易造成答案错位等问题。为此,本文基于光学字符识别技术实现一款阅卷系统,对该系统中的试卷校正方法、手写体字符提取和识别方法开展研究,提出一系列算法。主要创新工作包括以下三个部分。第一部分,针对试卷的校正问题,提出了基于定位符的试卷图像校正算法。试卷校正是手写体字符提取与识别的重要前置步骤,直接影响到阅卷系统的性能。一般来说,扫描设备获取的图像稳定且噪声轻微,而数码相机面对的情况则复杂多变,获取到的图像会有比较严重的噪声。为此,我们通过检测模板中预先设计的定位符来校正不同来源的试卷图像,由此实现了一款基于定位符的校正算法。实验表明,该算法运行速度快,抗噪性能强,能够稳定且精确地对试卷图像进行校正。第二部分,针对手写体字符的提取和规范化问题,提出了基于灰度直方图的自适应阈值分割算法。该算法通过字符区域的灰度直方图获取一个自适应阈值,由此实现对试卷图像中手写字符的分割。由于分割出的字符图像大小不一,灰度值差异大且包含噪声,我们进一步设计了一款字符规范化方法来得到分类器易于识别的字符图像,提高了字符识别效率。第三部分,针对手写体字符的识别问题,本文提出了基于“混淆感知”的卷积神经网络结构。在图像分类中,需要找到每个图像类别清晰的边界,但是部分图像类别的边界容易混淆。为了解决这一问题,本文提出了一种基于混淆感知的卷积神经网络。在训练阶段,首先训练一个预测分类器,使用交叉验证来估计预测分类器的混淆矩阵,然后基于混淆矩阵建立混淆感知模型,并为容易混淆的图像类别训练一组校正分类器。在分类阶段,预测和校正分类器通过分层结构协同使用,其中混淆感知模型被用作两层分类器之间的连接。在Mnist和CIFAR-10数据集上进行的实验表明,基于混淆感知的卷积神经网络性能优于现有的分类器。基于以上所提出的算法,本文实现的自动阅卷系统能够高精度地识别手写字符。在我们收集到的上千份中小学生的试卷样本上,该系统表现出稳定性与准确性都达到了实际应用标准。
其他文献
2016年,由消费升级诱发的供给侧改革,是十三五中国宏观经济改革的核心。供给侧结构性改革,是中央政府对制造业淘汰落后产能的决心,五金行业作为制造业的重要部分之一,也同样感受到
本文简要介绍了Z01与UAA2016两种无级调功模块的组成原理及其一些典型的实际应用电路。
品格证据规则是英美法系国家的一项重要证据规则,在美国刑事审判中被广泛运用。品格证据作为一种特殊的证据形式,针对不同的诉讼主体,有着特殊的运用规则。文章简要分析品格
一个新品类市场开拓之际,往往就意味着竞争格局被改写.锁具行业是否会改写呢?无数的营销事实证明,花再大的力气都不如发现一个新品类市场来得快.因此,如果不是某类产品中的第
<正> 本文介绍一种高性能的MOSFET功率放大器,它可应用于高保真立体声系统,也可用作电吉它的放大器。当使用&#177;30V电源电压时,4欧负载的输出功率为60W,当使用&#177;35V电
词汇附带习得有区别于传统显性教学的特点,是习得词汇的有效途径之一。国内学者通过研究阅读对附带习得词汇的影响,已证实阅读目的和学习者词汇量对词汇附带习得有显著影响。
本文分析高校经营性资产的特点及当前管理的现状 ,探讨经营性资产的管理方法 ,提出建立产权明晰的国有资产监管体系 ,完善经营性资产管理体制 ,加强内部审计在经营性资产运作
2016年1月11日,五金行业领军品牌雅洁五金以“解放压力轻装上阵”为主题的第17届经销年会在佛山三水绿湖度假酒店举行。会上,雅洁五金高管团队与来自全国各地400多名经分销商一
据了解,随着厨房功能一体化概念普及,“整体厨房”受到七成以上潜在买家的青睐。然而,由于行业门槛低、品牌不集中、缺乏统一标准、不知名的小品牌充斥市场等因素,目前的整体厨房
目的研究高频重复经颅磁刺激(rTMS)减少精神分裂症患者吸烟量及尼古丁渴求的有效性。方法本研究为随机双盲安慰剂对照试验,将60名符合入组条件的受试者随机分配至rTMS刺激组及r