论文部分内容阅读
在信息化高速发展的今天,数字图像处理技术已经应用在各个领域。OCR (Optical Character Recognition,光学字符识别)处理作为机器视觉和人工智能技术的代表正应用在军事、交通、医疗、办公和教育等各领域的科技产品中。在OCR处理之前,需要将图像处理成没有失真的理想状态。在实际中,因为诸多客观因素造成原始图像出现失真,包括光照不均、倾斜、透视变形和扭曲等,这些失真都将影响到OCR的识别效果,因此有必要在识别之前,对图像进行失真校正。本文将致力于解决图像中的扭曲失真问题,通过对扭曲图像和中文文字结构特征的分析,总结国内外近阶段在扭曲校正问题上的优秀研究成果,对比分析各种方法的优缺点,适当参考并创新研究,针对中文文本图像提出了基于连通域的扭曲图像校正算法。本文首先介绍了目前扭曲校正研究领域的最新发展现状,对经典的扭曲校正优秀算法进行总结分析,并简单介绍本文的算法思路。第二部分对扭曲校正的相关技术进行介绍和分析,都是图像预处理和连通域相关的常用技术,包括灰度化,二值化,图像去噪,图像裁边和搜索连通域等。第三部分,提出了本文的校正算法总体方案的设计思路,并对该方案设计进行可行性分析。第四部分开始介绍了基于连通域的扭曲中文文本图像校正方法的实现,对各模块设计和实现进行细致地介绍,其中重点介绍了预处理算法中的二值化、去噪和裁边算法,还有作为本课题创新点的文字提取和文本行定位算法,即字行交叉定位法,同时对各步算法的实现优化进行说明,尽可能提高整体方案的处理效率。第五部分是本文方法的测试数据分析和方法评测,利用实验结果,结合校正图像和相关校正数据以及OCR识别数据对本文方法进行客观分析,证实本文算法的实用性和有效性。最后结果表明本课题解决方案能够有效得解决扭曲文本图像带来的识别问题,而且很好地控制了方法的实现效率,对其在实际项目中进行应用有着广阔的前景和不错的价值。