多引擎OCR性能评测系统的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:nizhongyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别技术作为人工智能的一个重要研究领域,近年来得到了蓬勃的发展。OCR技术作为模式识别技术研究和应用的一个重要方面,也开始广泛应用于生产和生活的各个方面。目前,OCR技术在信息的自动录入、文本资料的保存和信息鉴定等领域都发挥着重要的作用。   一直以来,OCR性能评测的主要对象都是单引擎的OCR系统,即由一个引擎来完成图像文件识别全部步骤的OCR系统。但是,OCR研究领域有一个新的思路,即将多个OCR引擎集成到一个系统中,通过汲取各引擎的优点,来达到提高OCR系统识别效果的目的。   多引擎OCR系统的性能评测与单引擎OCR系统的性能评测有什么区别?如何实现多引擎OCR系统的自动化性能评测?这是本文研究的主要内容。   本文在对OCR技术和OCR系统的测试方法进行了简单介绍之后,又详细介绍了多引擎OCR系统以及系统的性能测试理论,随后,又详细调查研究了实现OCR系统性能测试所需的几个关键技术,并在此基础上设计和实现了一个自动化的多引擎OCR性能评测系统,而且使用该评测系统对南开大学机器智能所与天津南开越洋合作开发的多引擎Type Reader进行了性能评测,证明该系统已经可以基本满足多引擎OCR系统性能测试的需求。因为一个OCR系统的性能不仅受到识别模块的影响,还受到其他中间模块的影响。所以,本文设计的多引擎OCR性能评测系统,不仅可以测试整个系统的性能,还可以测试预处理模块和版面分析模块这两个中间模块的性能。
其他文献
“宽频带”和“非线性”是强激光科学技术领域中的两大核心关键技术,而自聚焦是其中最主要的非线性效应之一,它是使光束质量变坏和限制激光器输出功率的主要因素。宽频带激光脉
不可控剩余负荷的准确预测是微电网能源管理实现有效控制的基础,对于电力系统的可靠性、安全性和可持续发展都有着显著影响。随着电网技术的发展和微电网的出现,分布式能源得到了有效的利用。然而,不可控微电源又是分布式能源的重要成部分,其主要就是风力发电机和光伏太阳能电池板,因为风能和太阳能受到环境的约束比较大,发电量无法得到人为的有效控制。因此,为了保证微电网供电稳定,在不可控型微电源接入到微电网中必须要考
信息科技飞速发展的今天,互联网技术也得到了迅猛发展,电子文档的数量呈现了指数级增长,海量信息为用户提供方便的同时,也给用户获取有用信息带来了不便。如何有效地帮助用户
随着Web技术的迅速发展,尤其是通信技术的日趋成熟,实时通信技术在股票价格、新闻报道、余票查询、交通情况等领域中有着广泛的应用,但是目前的实时Web应用的实现方式,都是基
论文的目的是开发一个有着良好用户体验的电器视频交易系统。论文首先简要介绍了中国电子商务的发展历史与现状,得出了发展电子商务的企业在激烈的竞争中要留住客户,必须以良
随着互联网的迅速发展,计算机网络在经济和生活的各个领域正在迅速普及,整个社会对网络的依赖程度越来越大,这也使得网络安全问题变的愈发重要。为了预防目前越来越频繁出现的分
自上个世纪以来,随着计算机技术的飞速发展,人们可以更好的处理复杂数据,与此同时,高维数据分析技术也蓬勃发展。高维数据的本征维数估计问题研究,在高维数据处理领域中有着
在Web2.0时代,社会网络越来越流行,吸引了众多用户的关注,它允许用户发布并共享资源,建立基于社会关系的网络连接。社会网络的核心是维护虚拟社区内的用户连接,连接体现了一种社会
本文结合领域工程现有的研究理论、思想,进行面向领域的软件体系结构复用的实践。针对电子商务B2B贸易领域的商务平台,对其中涉及到的关键技术难点进行分析并给出解决方案,并
学位
智能变电站作为构建坚强智能电网的一个重要环节,承担着调整电压、分配电能、控制电流走向等功能,对智能电网的发展有非常重要的影响。目前智能变电站利用以太网作为通信网络,以太网延迟的不确定性对智能变电站通信网络报文传输的实时性有很大的影响。另一方面,当前智能变电站过程层单独组网的网络形式导致网络复杂性大,每增加一个新的应用、协议、设备,都会增加网络的复杂性,使得网络维护困难。针对这两方面的问题,论文提出