表格识别相关论文
测试文档是产品的重要组成部分,与测试数据紧密相关,且有严格的编制要求。针对以往测试文档编写中存在的重复繁琐、灵活性不高、效率......
冶金设备长期处于高负荷状态,工况十分恶劣,极易造成设备故障。而设备故障多以故障调查单及运维履历文档的形式由工人记录,存在内......
近年来,受光学字符识别技术发展的影响,文档识别的应用和需求与日俱增,自动地识别文档并从中挖掘关键信息具有实用价值。表格以直......
目前信息资源构成中仍然存在大量的文档资料,随着信息技术的不断发展,如何借助计算机技术对文档资料进行数字化处理、存储和管理已......
学位
在金融业务中,存在大量如报销、核验等对表单票据进行识别的需求。传统的文字识别算法对图像质量要求很高,且识别精度较低,具有更......
数字图像本质是2-D矩阵,其处理方法是进行各种图像变换。从这种角度来说,图像可以认为是一个动态离散系统,因此动态系统理论在图像处......
基于表格的影像文档类型识别是影像文档识别的一个重要组成部分,是图像处理与模式识别领域内一个重要的研究课题。随着表格识别过程......
表格识别是当前图像识别领域中的一个重要研究课题,由于信息化的普及和表格数据的大量出现,表单数据自动处理技术已经在很多行业和......
随着互联网的快速发展,越来越多的企业人力资源开始实施无纸化管理,员工个人信息,薪酬情况都会以数据流的形式录入计算机。但是涉......
科技文献是一种多模态数据,除文本外包含多种信息,比如图像、公式、表格、音频、视频、超链接等,这些信息相互解释、相互补充,为用户充......
Hough变换是一种常用的检测直线的算法.在表格识别的预处理阶段,对倾斜的表格进行倾角检测,Hough变换是一种比较好的方法,但Hough......
提出了一种单色表格的快速分析方法.其主要内容是:利用Radon变换检测表格的歪斜角度将其校正,用投影法找出表格线的位置,根据表格......
针对普通文档图像中表格结构的识别近年来已经成为了图像处理的研究热点。本文旨在探讨文档图像中的表格转换成Html表格的实现,通......
表格作为网页的一部分,蕴含丰富的信息,因而表格的识别工作已经成为了一个很值得研究的课题。把表格识别看作是一个分类问题,提出......
对手写表格数字识别系统进行研究,提出了输出规则的概念,解决了常用表格数据识别处理的输出描述问题。用此方法已成功地开发出手写......
基于表格自动录入系统中票据图像的自身特点,提出了一种基于游程的倾斜表格图像的快速检测及校正算法.通过对游程分布直方图的分析......
3 文字识别 清华TH—OCR for HP Version 7.0的界面可以分为几部分:菜单下面是工具栏,鼠标在上面放置片刻,会出现提示说明。左面是......
基于数学形态学的原理对表格框线进行检测,以横线与竖线的交点作为特征点.对结构元素采用了智能选取的方式,一方面可避免由于结构......
在数字影像中,理想的直线段由呈阶梯状排列的游程所构成。论文利用这一特征提出了一种检测直线段的新方法,它以逐行或逐列搜索带有......
表格的识别近年来受到了越来越多的关注,已取得了一些行之有效的成果,其中的部分方法要求知道表格影像的倾斜角度。给出了一种可以......
结合某铁路分局车辆段列车轮轴卡片自动录入及管理系统开发的实际,提出了一种单色表格的快速分析方法.其主要内容是:利用Radon变换......
针对Web数据挖掘预处理中,Web表格无结构化描述及缺乏清晰语义信息的问题,构建了面向结构的Web表格数据提取系统.利用HTMLParser库的......
本算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值。这一算法也可以用于快速检测其它......
提出了一种面向对象的表格图像版面分析方法,引入属性关系图的概念来描述表格版面结构,以表达表格组件间的复杂高维关系.属性关系......
近年来,我国矿山安全生产状况持续好转,但重特大事故仍有发生,安全形势依旧严峻。伴随2018年国家应急管理部的设立,我国的应急救援......
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构。提出了一种基于字线分离的预处理算法。该算法在不提......
为了对非固定样式的手写表格文档进行批量识别处理,实现自动录入功能,首先通过空表识别生成单元格信息,分析版面结构;其次对图片进......
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投......
通过分析表格的框线特征与结构特征,提出一种基于投影特征与结构特征的表格文本图像识别算法。该方法通过投影计算提取表格的框线......
数字图像本质是2-D矩阵,其处理方法是进行各种图像变换。从这种角度来说,图像可以认为是一个动态离散系统,因此动态系统理论在图像处......
介绍了一种扣车场信息管理系统.系统首次将表格识别及图文处理技术用于扣车场信息管理系统中,解决了扣车场各种表单的快速自动识别......
表格分析是对表格的基本结构及形状进行识别的过程,是以后能否从表格单元中正确提取文本信息的关键。在结合表格特点的基础上,采用......
表格在人们的日常工作和生活中扮演着重要的角色,它的形式多样,用途广泛。随着无纸化办公的普及,一套高准确率、高效率和健壮的表......
针对社区选举系统识别选票图像中的表格采用的同步道方法,造成选票设计复杂,需在系统中定义较多关于信息块位置信息的参数,和在印......
书籍报刊等印刷体文档图像的识别是模式识别领域的一个重要分支。文档图像中的字符识别较为成熟,市场上已经出现较多的商业产品。......
随着互联网信息技术的发展,越来越多的组织机构开始构建信息化系统以实现业务流程的无纸化处理,但涉及跨机构的协同业务时,由于保......
OCR 是模式识别中最热门的研究领域之一,而表格识别是OCR 的一个重要的研究和应用方向。本文主要讨论表格识别中的两个问题,即表格......
随着信息化时代的到来,相互交流的信息内容越来越丰富,一个中文信息文档中不仅会含有中文、英文、各种各样的公式以及表格和图形图......
该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精......
表格作为网页的一部分,它简单,容易使用,是一个非常常见的表示图解,而且表格里面蕴含丰富的信息,所以它对信息抽取,数据挖掘等领域......
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,......
边界跟踪与填充是图像处理的基本问题。链码间的转换是从已知一种链码获得其他链码的便捷方法。链码是获得图像几何特征的重要手段......
版面分析是版面信息处理系统的重要组成部分,旨在将纸制文档内容转化为电子信息,以便进一步通过版面理解实现版面数字化。版面分析的......
在日常的商业活动中,我们每天都运用了大量的文档和表格。同时表格文档也广泛地应用于各个领域,通常人们需要手动处理表格文档,例如客......