版面分析相关论文
蒙古文铅活字印刷技术的发明给我国蒙古民族文化和教育的发展带来了非常深远的影响。活字印刷实现了批量化、规模化生产,大大降低......
乌金体是一种常用的藏文字体,它不仅出现于日常使用的各类藏文文档中,也存在于记载着中华民族优秀文化的古籍文献里。在信息化时代......
随着互联网时代的到来,各种信息的数字化在人们的生活中随处可见。比如之前学生上课大多采用纸质书籍作为信息承载媒介,而近年来课......
文本检测与识别的相关工作在我们的日常生活中随处可见,如身份证识别、停车场的车牌识别等,极大地方便了人们的生活。不同应用场景......
本文对打印表格的共性及自动识别中版面分析和字符识别进行了探讨,提出通过对表格的整体定位,提取出要识别的数字图象,用笔划密度......
在阐释编辑整合规范的基本原则及其理论构建的基础上。提出一种新的编辑质量观。用这种新的编辑质量观来审视,优秀科技期刊也会存......
本文叙述了一个基于改进的"汉字识别特征点方法"的高精度简、繁体印刷体汉字文本识别系统。引入特征点的方向属性,明显地提高了"汉字识......
在当今时代,网络和多媒体技术迅猛发展,在促进了信息交换的同时,也带来了对信息的巨大需求。光学字符识别OCR作为计算机信息录入的......
随着信息时代的来临,人们处理信息更加智能化和高效化。传统的文档信息主要记录在纸质文档上,OCR技术实现了纸质文档信息的数字化,......
目前版面分析的基本思想有以下三个主要方向:自顶向下的方法、自底向上的方法和混合法,分别适用于不同的版面情况.该文提出了一种新......
文档图像处理的研究目的就是要利用计算机从文档图像中获取需要的信息.首先对文档图像处理和文档分析作一个简单概述,接着对版面分......
文档图像理解(Document Image Understanding)是把纸介质上的信息转变成计算机能够理解和编辑的信息,以方便保存和使用.在OCR技术......
通过OCR(Optical Character Recognition)系统自动识别图像上的文字对于信息检索、智能交通和票据、证件处理等方面有重要意义.通......
票据类文档是较为常见的一类文档,其中,银行票据又是应用范围最为广泛的的一种.目前,大量的银行票据仍然由人工进行处理,包括用户......
文档图像理解就是把纸质介质上的信息转变为计算机能够理解和编辑的信息,以方便保存和使用。在OCR技术已经相当完善的今天,图像分析......
OCR(Optical Character Recognition)系统的中文全称是光学字符识别系统,它包括脱机识别和联机识别两种.该文研究的基于网络传真图......
随着全球信息技术的飞速发展,文档数量急剧增加,人们的查询需求日益多样化,传统的文档检索系统已经不能满足用户需求,因此文档检索......
中文版面(特别是中文报纸版面)中文本域与非文本域经常交错嵌入。非文本域对文本域的提取会造成干扰。针对这种特点,本文提出了一种......
随着信息时代的来临,数字信息已经成为人类最重要的资源。而表单是最常见的一种信息载体,如何将表单文档中的信息电子化、数字化,......
随着信息科技、网络技术和通信技术的迅速发展,电子文档是如今信息传播和分享的主要载体。信息的不断膨胀对电子文档的存储产生巨......
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档OCR必不可少的环节,它是实现纸质文档数字化的重要环节。版面......
随着电子信息化进程的加快和互联网的快速发展,图像资源正海量的增长。越来越多的文档以图像的形式进行存储。文档图像中除了纯文......
银行为了扩大信用卡业务,每天会产生大量的关于申请信用卡的纸质银行表单。为了实现银行的信息化,需要将纸质银行表单上的信息录入......
随着智能终端和计算机技术的不断发展,文档图片作为纸质文档的一种替代品逐渐开始被很多政府部门、公司、学校等机构所使用,而如何......
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的......
我国历史悠久,珍贵的古籍藏书丰富,随着计算机技术的高速发展,利用计算机辅助古籍研究是必由之路。古籍图像版面结构复杂,对其进行......
近年来,随着人们对传统历史文化的保护和传承工作越来越重视,研究人员对历史文献数字化研究投入的精力也越来越多。藏族是一个拥有......
刚刚完成股份制改造的北京清华文通信息技术有限公司近期推出三个系列新产品:清华文通文字识别系统TH-OCR8.0单用户版和网络版、......
由清华大学电子工程系智能图文信息处理研究室研制的“基于识别的原文重现自动电子出版物制作系统(TH-OCR2000电子出版物制作系统......
大家在学校图书馆常能看到有价值的文章,可阅览室的杂志不好借,资料馆的借书数量也有限。别再疯狂摘抄到手发酸,带上数码相机,咔嚓一下......
目前,数字出版已逐渐成为出版业转型发展的一个重要方向。根据出版实践的需求,全国出版专业职业资格考试不断增加数字出版方面的内......
以前如果谁把扫描仪同复印机或传真机混为一谈的话,我是肯定会嘲笑他概念混乱的。但当MICROTEK的PageWiz扫描仪摆在我桌前时,我感......
OCR技术回顾 我国从80年代开始研制中文OCR技术,在国家科委的支持下,OCR支持取得了很快的进步,特别是经过1993年的印刷体汉字识别......
除前面讲过的手写输入及语音输入外,紫光输入大师还提供了扫描输入的方式。我们可能会有过这样的经历:在写一篇文章时需要参考一......
Uniscan 01000/O2000的市场定位在办公级应用,此两款高端办公级扫描仪是为了追求扫描图象质量的人专门设计的。
Uniscan 01000 / ......
扫描仪是把普通照片或实物转化为图片文件的理想工具,要是可以把自己或亲友的玉照加工成贺卡打印出来,那岂不是一件乐事?那么如何......
eWEEK(中国)试验室评测了惠普针对高端商务用户推出的Scanjet 3500C扫描仪,它装备了惠普光盘制作软件,可以帮助用户把他们的数字......
本文主要介绍包含公式识别功能的印刷体中文文档识别系统.该系统能够进行含有汉字、公式、表格和图形的中文文档识别,能够将无法修......
在简要介绍版式识别技术现状及面临的主要困难的基础上,提出了一种基于纹理特征的版面分析与字体识别方法,介绍了利用Gabor滤波器......
[目的]文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目......