文档图像的层分割研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xinxin3690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,文档图像在办公自动化、数字图书馆、电子商务、电子政务等项目中获得广泛的应用。在这些应用中,纸质文档通常采用扫描方式形成数字化文档图像进行存储、传输、显示和打印。为了保证对文档图像的有效处理,要求在用户能识别的前提下,对文档图像进行高倍的压缩。论文分析了文档图像的特点,指出文档图像是由一些具有特定性质的区域块组合而成,通常包括文字块、线图、连续色调图像(真彩色图)和半色调图像(带调色板的图)。其中,文字和线图保存了图像较多的细节以及结构信息,具有较高的空间分辨率特征,这一部分区域对颜色分辨率的要求不高;而连续色调和半色调的图像则保存了较多的颜色信息,通常要求较高的颜色分辨率,但对空间分辨率的要求不高。由此采用基于分割的文档图像压缩技术,对不同的分割区域采用不同的压缩方法可以获得更好的压缩效果。而对文档图像进行有效的层分割是论文研究的重点。借鉴1997年国际电信同盟(ITU)提出的文档图像层分割的建议标准,并结合目前的分割算法,论文提出了一种优化的文档图像分割模型。该模型将块分割和层分割的方法结合起来,采用改进的多尺度2色聚类的方法对块分割得到的文字区域进行再一次的层分割,从而得到文字的轮廓和背景颜色区域。然后将背景区域和块分割得到的图片区域进行逻辑合并,得到图像的背景层。这种优化的文档图像层分割的方法,有效地结合了块分割和层分割的优点,能够克服单一的文档图像分割算法的缺陷,得到较好的图像层分割效果,也为图像的后续处理打下了很好的基础。在文档图像的优化分割模型的基础上,为了解决多尺度聚类层分割算法中尺度选择的问题,论文进一步研究了基于Bayesian模型的多尺度分割算法。以树状结构表示图像像素以及特征空间之间的依赖关系,采用基于马尔可夫随机场的Bayes方法进行图像的层分割,以获得更准确的文档图像的层分割结果。论文的最后,完成了优化模型的分割实验并给出了示例图像的分割效果。并对分割的结果与单一的块分割和层分割的分割结果进行了比较。表明,优化的层分割模型能取得更好的分割效果。
其他文献
人脸检测的目标是从图象中判断有无人脸,如果有的话,输出人脸所在位置和范围.它作为一个重要的课题成为许多研究者的研究内容.人们觉得它如此重要是因为它在许多领域有着重大
学位
随着后PC时代的到来,嵌入式设备已经广泛地应用于办公自动化、消费、通信、汽车、工业和军事等领域,像手机、机顶盒、PDA、车载GPS系统、网络冰箱等新兴的嵌入式设备层出不穷。
像任何电力发电机一样,电力网络通过他们终端机上的电压调节器给仪器使用者提供能量。 很明显,电能质量取决于在发送点上的电压。这一个电压通常要承受许多干扰,这些干扰主要
日常生活中很多数据都使用分层结构来进行组织,例如图书馆的档案分类等.LDAP目录是将对象信息按照一定顺序(反映了对象的内容)组织起来的分层的列表(listing).分布式的目录由
该文的研究,其创新点可以概括为:1、在研究入侵特征的分析和提取的基础上,研究出一种性能良好的入侵特征形式化描述语言ISITL,并对其描述的语法、语义、相应的逻辑系统以及描
随着计算机图形学的高速发展,实时渲染技术在军事、娱乐、医学等众多领域上扮演着越来越重要的角色。在实时渲染技术中,渲染效果和渲染速度是一对不可兼得的矛盾体,如何有着
Web服务是一个崭新的分布式计算模型,它由一系列相关技术和标准所组成:XML、SOAP、WSDL和UDDI。其中,XML提供数据的描述,SOAP负责Web服务调用,WSDL负责Web服务描述,而UDDI则负责Web
人工神经网络从着手研究到现在,已有五十多年的发展史.虽然几经坎坷,但随着众多学者的不懈努力,不但在理论上为神经网络的发展打下了坚实的基础,而且在信号处理、计算机视觉
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向.研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程.因此,研究模式