彩色扫描文档图像的图文分割算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:peng23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对图像分割算法的研究巳有几十年的历史,借助各种理论至今已提出了上千种各种类型的分割算法。由于尚无通用有效的分割理论,因此现已提出的分割算法大都是针对具体问题的,并没有一种适合于所有类型图像的通用的分割算法。虽然有人试图对分割建立模型并根据模型进行分割,但并不太成功,定制化的分割方法才是有效的分割方法。文档图像已成为办公文档、数字图书资料等媒体的主要信息表现形式,如何对其进行高比率的压缩已成为研究热点,而基于图像分割的压缩则是图像语义压缩的核心问题。提高彩色文档图像的压缩比的有效途径之一是对图像的不同区域分别采用不同的压缩算法。本文提出一种利用图像处理技术、结合彩色文档图像自身特点、对文档插像区域进行定位与分割的方法。其主要工作如下:首先,阐述了图像的基本表示方法,然后讨论了现有的图像文件的一些基本的格式的异同;然后着重讨论了图像处理的基本目的和一般原理,及其中能用于文档图像分割的预处理的关键技术的具体实现方法,如平滑去噪声、二值化等。第二,通过对颜色特征及颜色空间之间的变换关系的讨论得出结论,即适当的色彩空间的选择对分割结果和效率有十分重要的影响。同时还讨论了现有的彩色图像的通用分割方法,它们不能很好的利用扫描文档图像的特性进行分割,提出了一种适用于分而治之压缩策略的彩色文档图像的分割模型。在该模型中先进行图文的块分割,再进行层分割。第三,详细叙述了基于多尺度的彩色文档图像的图文分割算法的具体实现,该算法的最终目标是将文档中插图区域和文字区域分离,即筛去特征图像的文字区域,保留插图区域。首先通过特征预处理(颜色空间的转换、去背景噪声和半色调挂网)增强图像区域的纹理,同时减弱非图像区域的纹理;然后为了达到去掉文本区和提高分割精度的双重目的,采用多尺度缩图;之后为了精确确定分割所需的标记图,结合小波多尺度边沿检测技术和连通区域的判定进一步提高分割效果;最后利用标记图和原图的拷贝进行图文分割。最后,对该算法的应用前景进行了叙述。在有效图文分割后,进一步的工作是对文档图像进行高倍压缩,实验证明这种基于图像分割的压缩显了提高压缩比。
其他文献
电网短期负荷预测是电力系统日常运行中的一项重要工作。精确的负荷预测,对电力系统安全、经济地运行起着重要作用。利用计算机技术进行电网短期负荷预测已经有较长的研究历史,目前有很多预测模型投入到实际应用中并且产生了良好的经济效益。在这些预测模型中性能比较突出的是径向基函数网络(RBF)方法。它起源于人工神经网络和距离加权回归,与典型的人工神经网络误差反向传播训练算法相比,具有网络结构清晰、训练过程收敛快
自从上世纪80年代以来,随着永磁材料性能的不断提高和电力电子器件的进一步发展,永磁同步电动机(PMSM)的快速平稳启动及速度控制技术的研究也进入了一个新的历史阶段。目前永磁同步电动机越来越多地应用在各种工业场合,研究与提高永磁同步电动机的控制技术也就有了重要的理论意义和实用价值。本文首先介绍永磁同步电动机及其控制策略的发展历程和现状,着重阐述矢量控制理论的发展和应用方式。从永磁同步电动机结构与工作
Internet已经成为当今和未来人们获取信息资源和进行信息交流的主要场所,然而要想在信息量浩如烟海的Internet上找到需要的信息,是一项极富挑战性的工作。目前,传统的信息搜索工
随着网络和多媒体技术的发展,流媒体应用开始越来越普及。为了适应流媒体应用对实时性的要求并有效地缓解网络带宽瓶颈,流媒体缓存技术应运而生。通过把流媒体缓存配置在客户
Kerberos是由麻省理工大学开发的一个基于对成密码技术和用户口令的,第三方的网络认证协议.该文在学习研究Kerberos协议,以及麻省理工大学和微软提供的Kerberos认证系统的实
近年来,随着电子商务、电子政务的发展,企业级应用的概念逐渐被软件开发人员和市场所接受。企业级应用的开发已经成为软件产业发展的主要动力。同时,企业级应用的快速发展给软件
基于组件对象模型(COM)的矢量图形编辑系统提供一个独立于其他具体应用系统的图形编辑环境,采用COM技术构建。按照组件化设计的思想,将系统各个大的功能模块作为一个独立的组
万维网地理信息系统(WebGIS)是Internet技术应用于传统地理信息系统(GIS)的产物,GIS通过WWW功能得以扩展,正在成为一种大众化的工具。但是,随着WWW技术的蓬勃发展,WebGIS的进一步发展
数据库管理系统可能会因一些不可预知的软硬件故障影响事务的正确执行甚至破坏数据库,降低它的可靠性和可用性。数据库系统的备份与恢复部分正是要解决这些问题。本课题以“
虚拟机实时迁移是虚拟化技术的一个重要特征,对于近年来不断兴起的数据中心的负载均衡和灾难恢复有非常重大的意义。通过虚拟机的实时迁移,把虚拟机从源物理主机硬件平台迁移