基于连通域的扭曲文本图像校正方法研究与应用

被引量 : 4次 | 上传用户:lengyubo88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化高速发展的今天,数字图像处理技术已经应用在各个领域。OCR (Optical Character Recognition,光学字符识别)处理作为机器视觉和人工智能技术的代表正应用在军事、交通、医疗、办公和教育等各领域的科技产品中。在OCR处理之前,需要将图像处理成没有失真的理想状态。在实际中,因为诸多客观因素造成原始图像出现失真,包括光照不均、倾斜、透视变形和扭曲等,这些失真都将影响到OCR的识别效果,因此有必要在识别之前,对图像进行失真校正。本文将致力于解决图像中的扭曲失真问题,通过对扭曲图像和中文文字结构特征的分析,总结国内外近阶段在扭曲校正问题上的优秀研究成果,对比分析各种方法的优缺点,适当参考并创新研究,针对中文文本图像提出了基于连通域的扭曲图像校正算法。本文首先介绍了目前扭曲校正研究领域的最新发展现状,对经典的扭曲校正优秀算法进行总结分析,并简单介绍本文的算法思路。第二部分对扭曲校正的相关技术进行介绍和分析,都是图像预处理和连通域相关的常用技术,包括灰度化,二值化,图像去噪,图像裁边和搜索连通域等。第三部分,提出了本文的校正算法总体方案的设计思路,并对该方案设计进行可行性分析。第四部分开始介绍了基于连通域的扭曲中文文本图像校正方法的实现,对各模块设计和实现进行细致地介绍,其中重点介绍了预处理算法中的二值化、去噪和裁边算法,还有作为本课题创新点的文字提取和文本行定位算法,即字行交叉定位法,同时对各步算法的实现优化进行说明,尽可能提高整体方案的处理效率。第五部分是本文方法的测试数据分析和方法评测,利用实验结果,结合校正图像和相关校正数据以及OCR识别数据对本文方法进行客观分析,证实本文算法的实用性和有效性。最后结果表明本课题解决方案能够有效得解决扭曲文本图像带来的识别问题,而且很好地控制了方法的实现效率,对其在实际项目中进行应用有着广阔的前景和不错的价值。
其他文献
目的:运用数据挖掘技术,同时根据“人机结合,以人为主”的研究方法,结合与安效先教授的访谈学习,整理总结安老师诊治儿童咳嗽变异性哮喘的临床经验及其学术思想。方法:本课题研
<正>超精密飞刀铣削是一种高精度多轴联动铣削技术,广泛应用于加工具有亚微米级尺寸精度和纳米级表面粗糙度的非旋转对称微纳结构表面。然而,加工过程中出现的刀具磨损将导致
互联网的出现,打破了原有的传播模式,催生出了一些新的传播平台,而微博传播平台的出现,使传播方式出现了更加前所未有的改变,微博以崭新的面貌使信息更加快捷、方便、迅速地
目的探讨经胆道镜等离子体冲击波碎石术(PSWL)应用效果及操作技巧。方法我院2004~2009年期间经胆道镜行PSWL破碎巨大残留结石56枚(54例),其中残留结石直径≤10mm 9枚,10mm<直
粮食安全问题是关系国民经济发展、社会稳定和国家自立的重大战略问题,农业环境问题则是中国农业是否能够实现可持续发展的关键。未来十年,中国高集约化的农业土地利用方式既
19世纪末、20世纪初,西方各领域对人的主观时间、心理时间开始深入挖掘,时间问题成为该历史时期思想形态的重要组成部分。哲学、艺术对于人的生存时间性表现出强烈关注和思考
随着时代发展,不同国家与文化间的交往与联系更加频繁与紧密,这对外语教学中的跨文化能力培养提出了更高要求。德语移民文学是由有移民背景的作家用德语创作的文学作品,这些
信息技术和现代工业的飞速发展,智能手机、平板电脑等移动设备的快速普及,使得通过拍照获取图像十分常见。利用计算机、互联网等信息处理技术来存放和处理图片与文字已成为主
尽管我国是茶叶生产大国,但是目前在茶叶市场上的表现却并不如意:在国际市场上,我国茶叶出口低于肯尼亚,占总产量的比例就更低了。在国内,线下市场经过发展也面临了增长瓶颈,
作为非政府组织,中国社会福利协会主要负责落实国家社会福利相关的政策法规以及开展国内外交流与合作。协会英文网站可向世界展示中国在社会福利方面的重要成就,帮助中国树立良