二值化及其在支票识别预处理中的应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:jiandancaozuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二值化技术(算法)作为图像分割技术中的一种,本质上是通过阈值(Threshold)的选择将数字图像中的像素点进行分类的技术。作为一种重要的图像分割技术,它在图像模式识别系统中对系统的最终识别率有着极其重要的影响。图像模式识别系统由图像预处理和模式识别两个子系统构成,图像预处理系统主要完成待识别目标的分割、特征提取等任务,而二值化技术则是将待识别物体从复杂背景中分割出来的主要手段;如果待识别物体无法从背景中分割出来或者分割的效果较差,那么无论识别算法本身的好坏,图像模式识别系统都将无法较好的完成识别任务。支票识别系统,作为图像模式识别系统中的一种,它利用DIA(Document Image Analysis)技术和OCR(Optical Character Recognition)技术完成对支票图像中目标物的分析和识别任务,而二值化技术在整个系统的预处理中扮演着极其重要的角色,是文本图像分析(DIA)和光学字符识别(OCR)的基础。在支票识别系统中,支票经过扫描后,形成一张支票数字图像,对此图像进行预处理的关键是获得一张支票图像的二值图像,从而将目标物体与背景分割开来。该二值图像作为后继处理的基础,对后继处理(金额栏提取、字符识别等)有着至关重要的影响。在支票识别系统中,由于票面背景复杂(印章、底纹),所以二值化问题是一个既关键又难以很好解决的问题。本文以关于二值化技术的综述性文献[9][10][11][12][13][14]为基础,对二值化技术及其相关问题进行讨论,同时,针对支票自识别系统的具体特点,经过研究和总结,本文提出了一种基于直方图最大梯度值的、用于整票二值化的算法;该算法较好的满足了支票识别系统预处理中整票二值化的需要。本文的贡献主要有以下几个方面:总结了支票自动化处理系统实现的三种模式;介绍、总结了多个经典二值化算法;利用直线检测结果等多个定量标准来评价二值化算法的好坏;研究了图像扫描的分辨率与二值化处理之间的关系。本文的主要创新点在于:(1)提出了一种用于整票二值化的算法。该算法基于直方图的最大梯度值,具有简单、高效、可靠的特点,能够较好的满足支票自动化识别系统中整票二值化的需要。(2)将直线检测结果用于对二值化算法效果的评价。此种定量的评价方式能够更好的评价、反映二值化结果对后继处理(直线检测)的影响。
其他文献
在电信企业前台营业受理和服务中,证件信息的手工录入、证件图像的复印和通过密码查询用户信息等皆因为手工作业用时长、效率低、用户信息安全保密差等原因一再影响电信企业
人体生物特征识别技术(Biometric)是一种将信息技术与生物技术相结合,利用人体本身具有的生物特征进行身份识别的技术。生物特征识别将在国家安全、金融证券、社会福利、电子商
文本检索是信息检索的重要组成部分,目前几乎所有搜索引擎都是采用基于关键词的检索方法,其核心是关键字符的机械式匹配,存在的问题之一就是召回率和准确率比较低,从而导致检
随着网络技术的快速发展以及应用领域的不断延伸,P2P技术凭借开放灵活的体系结构,在Internet诸多领域都得到广泛的应用。文件共享、多媒体传输、数据存储、分布式计算等显示了P
三维物体运动估计是计算机视觉中的一个重要部分。它包括刚体和非刚体的运动分析。区别于传统的基于匹配与基于光流的分析方法,本文采用基于神经网络的分析方法,对三维刚体的运
随着社会和科学技术的蓬勃发展,特别是Internet技术在最近十年内的惊人发展,各种各样的通信服务被广泛运用,大大方便了人们的生活。同时随着新型网络技术的不断出现,人们对信
入侵检测系统作为一种主动的安全防护工具,能够在计算机网络遭受危害之前发现入侵攻击,并通过对入侵进行拦截、警报等,为计算机网络提供安全保障。但随着大量高速网络技术的出
步态是指一个人行走时整个身体的运动姿势。具有远距离、非接触性、难于隐藏和伪装、易于采集等优点。步态识别是近年来越来越多的计算机视觉研究者所关注的一种较新的生物认
VoIP(VoiceOverInternetProtocol)是目前Internet应用领域的一个热门技术。它实现了语音在Internet上的实时传送。其基本原理是:通过语音的压缩算法对语音数据进行编码压缩处
当前,云计算和大数据的研究如火如荼,移动互联网深入发展,图像安全和隐私保护受到更多关注,为应对这些现实性的需求,有必要加强图像加密的研究。混沌作为一门新的科学,它与密