文档图像中表格结构的自动定位与分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:ZSMJ_AYA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表格是一种结构紧凑、格式良好、便于检索与排版的数据组织与表达形式,在各类文档中被广泛使用。针对普通文档图像的表格版面结构自动定位与分析成为近年来文档图像分析领域(DIA)的研究重点。由于表格结构的多样性和复杂性,以及现实世界大量噪音对图像质量的影响,表格版面结构的自动定位与分析涉及许多公开性难题(如结构描述、系统搭建、自动评测等),现有技术水平难以满足一般应用领域的性能需求。本文面向一般应用,基于对前人研究成果的总结,结合丰富实践经验。创造性的提出了通用表格版面结构描述模型,对版面结构与逻辑结构进行独立描述,并建立了两者的直接映射关系。使用简单区域集合描述表格版面结构,使用网格矩阵对版面信息进行高度抽象和表达。使用单元格链表保存逻辑数据。通过对图像信息合理的分层描述和提取,有效克服了图像质量低下造成的处理困难,满足了一般领域大规模应用的性能要求。本文首创提出基于线条交点矩阵进行表格结构分析自动评测的方法,将等价于“图匹配”的难解问题转化为二维矩阵局部最优匹配的有限计算问题。这种方法不仅能够对局部处理结果进行定量的评测和统计,同时能够利用全局特征进行错误的定性分析。这种新颖的评测机制为表格结构自动分析系统的升级、应用和推广提供了重要的评测保证。本文基于“以系统优势体现机器智能”的思想,通过对算法流程的合理架构,实现了功能稳定、性能优异的表格版面结构自动处理系统,并将其成功嵌入到成熟的DIA系统中。基于实际图像样本集的测试数据证明了系统运行的稳定性和处理性能的高效。
其他文献
以两圆柱体相贯线的绘制为例,概述了传统机械制图中相贯线作图方法的一般步骤,并通过实例进行了作图演示,对运用计算机绘图软件AutoCAD快速绘制相贯线的方法与技巧进行了研究探讨,提出了四种运用AutoCAD软件便捷绘制相贯线的作图方法,并就绘图步骤进行了详细论述。通过对比发现,AutoCAD软件在绘制相贯线方面更为方便适用。解决了长期以来相贯线绘图难的问题,增强了同学们计算机绘图的兴趣与能力,对同学
初中数学学科素养是指学生能够运用数学这门学科后特有的思想方法、思维方式去分析、解决问题;能够运用学过的学科知识解决问题;对所学的学科知识,能全面、系统地认识、理解;
目的观察颅骨动脉瘤样骨囊肿的CT和MRI表现。方法回顾性分析8例经手术病理证实的颅骨ABC患者的CT和MRI图像,发生于脑颅骨者5例,其中枕骨3例,顶骨1例,颞顶枕骨1例,发生于颌骨2
经过近四十年的改革开放,特别是2001年中国加入WTO后,我国企业的科技创新能力逐步提升,在国际市场的竞争力日渐加强,我国企业进出口额增长迅猛。自2005年7月21日我国汇率制度
我校是一所偏远的山村小学.有学生98名,其中大部分为留守儿童.学生们从星期一到星期五都生活在学校里.学生在校时间长,加之年龄又小,他们的安全问题成了我校头等大事.为了学
期刊