复杂背景下的图片文字检测算法研究

来源 :中国科学院研究生院(本部) 中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:qjunp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图片文字检测是文字识别过程的重要步骤,对它进行研究有着重要的理论和应用价值。在本文中,我们提出了以边缘纹理作为检测文字的主要特征。提取出图像的边缘纹理后,我们初始的系统采用简单的判定规则来进行文字区域的判定。在初始系统的基础上,我们做了多方面的改进,新的系统先对图像进行初检,然后再用训练后的SVM来进行验证,使得文字检测性能大为提高。本文完成的主要工作有两点:   1.提出基于边缘纹理和判定规则的图片文字检测算法。该算法通过小波变换提取四种方向上的边缘,用共生矩阵对边缘进行纹理分析,然后根据分析结果设定规则,判断图像区域是否含有文字,最后进行连通分量分析调整文字框。   2.提出基于边缘纹理和SVM的图片文字检测算法。该算法分析了Canny边缘的纹理特性,用SVM生成判决平面,取得了较好的检测性能。在该算法中,我们根据图片文字的特点,修改了Canny算法中的阈值选取步骤,使之适合于文字检测的需要。在文字初检步骤中,我们利用双阈值和边缘跟踪代替传统的阈值化分割,使得初检效果更加理想。另外我们对连通分量分析算法也做了一些改进。
其他文献
二进制翻译技术是用软件方法解决代码移植问题的重要手段.二进制翻译技术的研究,不仅在遗产代码移植而且在程序性能提高等其它方面都有重要的意义.本文全面调研了二进制翻译
本文对基于Java的工作流管理系统设计与实现进行了研究。文章指出,工作流管理系统是一个软件系统,它完成工作流的定义和管理,并按照在计算机中预先定义好的工作流逻辑推进工作流
本文用可证明安全的方法研究了分布式系统中隐私保护和隐私认证问题。隐私保护是指保护用户隐私信息不被泄漏;而隐私认证是指在认证过程中保护隐私信息不被泄漏,如在身份认证过
学位
随着市场经济的推广,对于生产制造行业来说,产品的生产导向越来越受市场需求的影响。虽说很多企业拥有信息化系统来控制生产过程,但是企业所面临的两大问题,即快速响应市场需求变
学位
面对日益复杂网络威胁,本论文就规划识别及其应用的理论和关键技术进行研究,目的在于探索新型的网络安全保障方法,掌握网络对抗主动权。本论文主要取得以下六个方面的研究成果: 
学位
随着计算机技术的迅猛发展,信息技术的突飞猛进,数据挖掘技术成为当今最重要的研究领域之一。关联规则挖掘(ARM)是数据挖掘最重要的方向之一。传统的关联规则挖掘是为了找出项
学位
本文首先对无线传感器网络的体系结构、传感器节点结构以及无线传感器网络区别于传统网络的特性做了简单的描述,分析了无线传感器网络所面临的安全威胁,探讨了无线传感器网络协
在集成电路技术发展的初期,电路工作速度较低、器件特征尺寸尚未达到深亚微米级,门延时远远大于互连线延时,可以将互连线看作是一种仅仅具有电气连通作用的理想金属导体,忽略
随着嵌入式系统、网络技术与自动控制技术的发展与成熟,信息物理融合系统(Cyber Physical System,CPS)这一术语被提出,被视为继计算机,互联网之后的又一重要里程碑。CPS在结构与
随着互联网和信息化技术的蓬勃发展,包括网页文档和其他数字化资源在内的各类信息库和知识库的规模也在飞速增长,这对负责管理和检索这些文档集合的系统(其中最典型例子就是搜索