试卷文本检测技术研究

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:rette
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对高质量教育需求的增长以及人工智能技术的发展,个性化教育成为一个非常具有前景的方向,线上与线下教育的有机结合是个性化教育中非常重要的一个环节。线下教育过程中通常会产生大量的纸质试卷,手机拍摄试卷图像是非常便捷的一种方式,因此将试卷图像中有效信息抽取出来并将其转换为文本是个性化教育过程中非常重要的一个场景。文本检测是文本识别的基础,其目标是将图像中文本区域标注出来,传统图像处理和深度学习在文本检测领域均取得了一些成果,但也存在不同的问题。目前文本检测技术大致分为两个研究方向:自底向上方向和自顶向下方向。自底向上的方法一般采用传统图像处理方法,通过人工设计特征检测字符和文本框,由于缺少语义信息容易将部分背景检测为文本。自顶向下的方法通常使用深度学习方法训练端到端的检测模型,在训练过程中需要大量的标注数据,但因为试卷中文本框密集,对试卷进行大量文本标注在试卷文本检测场景中是昂贵且不可行的。虽然目前已经有很多文本检测算法,但是针对试卷文本检测场景的并不多。试卷文本检测可以视为文本检测的一个特殊场景,是一项具有挑战性的任务,其难点在于需要从不同大小、图像质量参差不齐、文字图表混合、手写字符打印字符混合的试卷图像中检测文本,试卷图像文本框较多导致数据标注难度大。为了解决上述问题,本文提出了基于判别器的试卷文本检测算法(TDCD)和基于DQN的试卷文本框微调算法(TDMA)。本文的工作内容和创新包括以下四方面:(1)为了解决试卷文本检测中存在图像质量参差不齐、文字图表混合、标注成本昂贵等问题,本文提出了TDCD算法。首先对试卷图像预处理得到连通区域外接矩形,然后基于传统图像处理方法和卷积神经网络设计了字符判别器(CDM)用于指导连通区域外接矩形合并,最后通过文本线构造法生成文本框。TDCD算法无需大量的试卷文本框标注数据和人工设计特征便可获得较好的检测效果。(2)为了进一步提高试卷文本框的检测精度,本文提出了TDMA算法。首先设计了试卷文本框微调的各种动作,然后借鉴R-FCN中Ps-Ro I Pooling结构设计了双分支融合估值网络,最后通过?-greedy策略对动作进行选择。本文实现并验证了通过强化学习微调试卷文本框的可行性。TDMA算法适用于提高任何试卷文本检测模型的检测精度也为其他矩形目标检测结果微调提供了思路。(3)目前尚未有针对试卷文本检测的开源数据集,在评测试卷文本检测效果时,本文收集并标注了试卷文本检测数据集EPDB。在训练及测试字符判别器时,本文制作了字符判别数据集CDB。为了减轻数据标注压力,CDB的训练集与测试集数据分布不同,设计了一种数据分布自纠正策略,通过不断迭代使字符判别训练数据与测试数据趋于一致。(4)在EPDB和CDB上的大量实验表明:本文提出的TDCD可以有效用于试卷文本检测,F-measure达到66.3%,在试卷文本检测场景优于其他算法;TDMA可以进一步提高文本检测效果,其中TDCD检测结果的F-measure可提升1.2%;数据分布自纠正策略可以在降低数据标注量的情况下取得有效的判别效果,其中AUC可提升21.8%。
其他文献
大型工业设备滚动轴承故障不仅仅会对经济造成损失,更重要的是会危及人们的生命安全,随着科技的进步与飞速发展,从传感器中获取大量的振动信号已经司空见惯。所以,分析大型工
我国煤层赋存条件复杂多变,在各种条件下探索研究合适的开采技术,以延长矿井的生产服务年限,增强煤炭资源的回采率,一直都是我们国家亟待解决的重要问题和焦点。最近这些年,
目前,我国主流的抗震设计方法仍然基于“小震设计,大震验算”的理念,但基于“大震设计”理念的抗震设计方法正日益得到重视。该方法的可靠性有赖于地震作用的模拟方式,而基于
随着生活水平的提高,人们更加注意建筑室内的热舒适性,大量能源消耗在建筑行业。利用可持续且无污染的能源替代常规冷热源,可以有效降低建筑在供暖和制冷方面消耗的能源,地热
三电平SVG具有精确的无功补偿功能、快速的响应速度等优点,在电网中有着广泛的应用。从三电平SVG的T型拓扑结构和中点电位平衡问题两个方面深入研究并提出了可行的改进设计方
公路作为公共产品,为经济社会发展作出了巨大的贡献,为人民出行交通提供了极大的便利,但随着经济社会的发展,城镇建设的日益加快,公路养护承载压力日益增大,出现了因车辆增多
文丘里施肥器由于结构简单、成本低、无需外部动力等优点,在微灌系统中得到了广泛的应用。但在实际应用中,施肥浓度固定,难以实现肥液浓度自动调节,制约了装置的应用范围,尤
随着保护环境的呼声愈高及常规能源的枯竭,新能源的发展越来越受到大家的关注。其中,作为无污染的可再生能源之一的风能,在全球各地得以大力的开发。然而,由于风的强波动性和
以输电和配电通信网主要部分的电力通信光网络是现代电力系统组成的关键部分,电力通信光网络所传输的数据及业务与电力系统生产、运维、调度和监管有直接联系,因此,保证电力
近年来,人类活动的频繁干扰如过度放牧、耕种、砍伐森林和人工造林大大改变了土壤和大气之间的碳平衡,从而减缓或加速了全球气候变化。而土壤是陆生生态系统中最重要和最活跃