基于图分割的文本提取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:exiaodong1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字科技的迅速发展,从图像中提取文本信息的研究越来越受到人们的关注。图像中的文本能够提供有用的信息,是描述图像内容的关键,这些信息可以作为图像资料的自动注释、索引、压缩等方面的重要参考。从图像中提取文本信息需要经过文本区域检测、定位,字符提取,字符识别等步骤,文本字符提取是从图像中自动提取文本信息的重要一步。本文首先改进了一种基于图分割理论的阈值分割方法。将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。矩阵M表示了待处理图像的灰度图像内各灰度值的相似度,采用遍历的方式找出其中应用图谱分割评价标准的值最小的灰度值。选用这个灰度值,作为阈值分割点。本文提出了一种基于直方图的谱聚类分割方法。首先将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。然后应用图谱分割的算法,对矩阵M进行分类,最后的分类结果将256个灰度值分成了两类,进而实现了对原图像的分割。纹理是文本图像中的重要特征,文本区域往往具有不同于背景的特殊纹理。本文利用字符区域的纹理特征结合直方图的图谱分割方法,构建了一个二次聚类框架实现对复杂背景图像的字符提取。本文还将灰度图像中的字符提取方法推广到彩色图像中,对彩色图像的每一个分量应用基于直方图的图分割方法,运用投票策略,实现了彩色图像中的字符提取。最后,本文提出了一种用来评价字符提取效果的标准,在此标准下,验证了前文中提出的各种方法,实验结果表明,基于直方图的谱聚类字符分割方法优于阈值化分割,对具有复杂背景的字符图像能够有效地分离出字符。
其他文献
机制设计是微观经济学和博弈论的分支领域,它的核心思想是设计某种规则,在理性代理参与的条件下,达到既定目标,获得最大社会利益。但由于代理能力的有限性和外部环境的不确定性,不
身在电子信息量快速增长的社会,如何在海量的信息资源中迅速准确地找到所需信息,是当前信息处理领域的一个重要问题。文本分类的出现很好地解决了上述问题。文本分类是基于文本
Web服务可实现应用程序在Internet上的互操作,已成为一种具有发展潜力的分布式网络应用集成技术。服务发现是Web服务技术中的一个重要环节,进行Web服务发布、发现的组织,快速
蛋白质的生物功能是由其空间折叠结构决定的,因此预测蛋白质的折叠结构是生物信息学领域中极具挑战性的问题之一。近年来,许多研究者从事蛋白质简化模型的研究,这些模型基于
近几年来,基于生物免疫的网络入侵检测是网络入侵检测研究领域的热点,它的突出特点是利用生物免疫系统的机制来实现对入侵行为的检测。生物免疫系统具有多样性、自适应性、耐
光学三维测量技术拥有大量程、大视场、非接触等其他测量技术不可比拟的特点,因此该技术被广泛应用于涉及物体三维表面轮廓形状测量的各个应用领域。其中基于结构光的三维测
从上世纪末开始,由于基于宽带卫星数据网络的快速发展,整个卫星通信行业又开始进入新一轮的快速增长期。有许多投资巨大的宽带卫星通信网络系统正在研制或者即将发射运行,这
随着信息时代的到来,各种信息资源越来越丰富,尤其是互联网资源。为了能够从这些海量数据中获取所需要的各种各样信息,需要高效的信息检索系统,它是人们获取所需信息的钥匙。
三维网格模型编辑方法在计算机辅助几何设计和计算机动画等领域具有重要的作用。由于自由变形技术和多分辨率编辑技术对模型的几何细节处理存在一定的问题,因此产生了新的几何
随着计算机技术的日臻成熟,越来越多的关键数据被存储在计算机系统中,因此数据的安全性至关重要。近年来,容灾尤其是跨网络远距离容灾得到了业内人士越来越多的重视和认可。