【摘 要】
:
近年来,随着计算机技术、多媒体技术的飞速发展,表格影像文档的自动分类、存储和管理日益成为人们研究的热点。而表格影像文档的特征提取是影像文档自动管理领域里重要的研究课
论文部分内容阅读
近年来,随着计算机技术、多媒体技术的飞速发展,表格影像文档的自动分类、存储和管理日益成为人们研究的热点。而表格影像文档的特征提取是影像文档自动管理领域里重要的研究课题之一,对图像本身进行深入研究,通过合理的提取其特征,来提高影像文档分类的速度以及分类的准确性己成为必然要求。
当今虽然对表格影像文档处理进行了大量的研究,而且在一些行业已经应用,但这些系统基本上都是针对专用表格,对通用表格的分析和识别还不成熟。因此如何对通用表格特征的提取以及通用表格的分析和分类已经成为研究的热点。基于以上原因,本文以图像处理和模式识别理论为基础,研究了两种通用表格特征提取方法,并通过Matlab仿真,验证了算法的有效性。具体研究工作包括以下三方面:
1.在表格预处理阶段,本文提出一种简单有效的去除黑边的方法,该方法利用数学形态学原理首先对表格图像进行开运算,得到只有黑边的和原图一样大小的图像,再利用图像减法运算,可以很好的将黑边去除。
2.在特征提取阶段,研究了一种简单实用的通用表格特征提取方法,将表格结构作为表格识别特征。其处理过程是:先提取表格中的线段,再按照本文算法对相关线段进行合并或剔除,最后根据表格特性调整表格线,得到完整的表格结构。经实验结果表明该方法是可行的。
3.在对第一种特征提取算法分析的基础上,又给出了基于傅立叶变换特征提取算法。该算法综合考虑表格文档水平和垂直投影方向的信息,以傅立叶变换后的频谱作为特征,并采用BP神经网络作为分类器,实验证明这种特征可以有效地解决对称表格分类难的问题,并具有很好的抗干扰和泛化能力。
其他文献
目前,国内基于数据挖掘在中医证治的研究尚不完善,基本上都是基于单一数据挖掘算法的研究,未见有采用半开放的挖掘模型组技术,更未见有建立基于互联网的证治规律挖掘与应用软件。
体绘制技术是科学计算可视化的一种重要方法,它能够从体数据集中抽取内在的本质信息,并借助交互式图形图像技术展现出来。由于体绘制是将三维空间的离散数据直接转换为二维图
云计算是近几年IT领域比较热门的研究方向,云计算时代的到来,不仅仅改变了互联网的技术基础,而且还对整个IT行业产生深远的影响。云计算将数据存放在数据中心中,应用所需要的
P2P网络中所出现的各种攻击成为威胁网络正常运作的主要因素,而这都是因为有恶意节点的恶意行为存在所导致的。如何在P2P网络中识别出恶意节点,约束和杜绝节点的恶意行为成为
随着大规模网络的激增,网络的复杂性和异构性的特点日益突出,加强电信网络资源管理成为当前各级电信企业迫切需要解决的重要任务。然而,传统电信网络资源管理大部分只停留在
无线传感器网络融合了网络、信息、通信以及半导体等先进技术,在环境监测、国防军事、工业、公共卫生事业以及野生动物保护方面得到了广泛的应用。长期以来,无线传感器网络的
在网络管理中普遍存在信息安全保障和资源有效分配等方面的问题,这些问题都与用户的操作行为密切相关。本文针对基于Web日志的用户访问模式挖掘问题进行了较为深入的分析和研
当前互联网高速发展,使得海量的、内容丰富的文字信息以计算机可读的形式存在,并且其数量每天仍在急剧增加。为了有效的管理和利用这些分布的海量信息,基于内容的信息检索和
本文以绝经综合征为基础,对中医药临床疗效评价方法进行深入的研究。在国家“十五”攻关项目研究所取得的成果数据库和基本疗效评价指标体系的基础上,以症状指标、生化检查指标
随着网络应用技术的发展与进步,软件架构发生了从C/S到B/S的转变。然而,B/S模式不能解决所有客户端应用问题。人们发现简单的浏览器页面已经不能满足新的需求,丰富快速的用户体验及