基于字线分离的表格识别预处理算法

来源 :计算机工程与设计 | 被引量 : 5次 | 上传用户:haoxiaoye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构。提出了一种基于字线分离的预处理算法。该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离。实验结果表明,该算法能够滤除大部分文字像素、准确有效突出表格文本图像中的框线信息,达到了预处理目的,是后续表格特征提取和识别的有效预备步骤。
其他文献
在全面深化“以病人为中心,以提高医疗服务质量为主题”的医院管理年活动中,温州市二院成立了浙江省首家客户服务中心,将病人视为客户,经过细化服务工作,突出个性化、人性化,开展一
采用韦纳归因理论对初中生体育学习成功和失败的动因阅卷调查结果,进行归因特征分析,得出初中生体育学习成功和失败的归因结论及姓别归因差异,将研究的理论结果用于体育教学,
估算电子商务软件的年运行维护成本,对于维护人员安排和资金预算具有重要意义。通过论述电子商务的特点,从技术和非技术两个方面分析影响软件维护成本的十二条因素,以表格方式列
随着网络的普及和发展以及网络信息量的日益增加,为广大用户提供个性化服务显得尤为必要。在对个性化服务技术相关知识进行概述的基础上介绍了协作过滤信息推荐技术的基本原理
建立了采用离子色谱分析Na^+、Zn^2+、K^+、Fe^2+、Mg^2+、Ca^2+6种金属离子的方法,实现了6种金属离子的基线分离,该方法灵敏度高、重复性好。通过对聚合诱导胶体凝胶(PICA)法、溶胶