基于统计分类器的银行票据自动处理系统若干关键技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:cenyizhon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的研究目的就是参考国内外最新研究进展,在PRIS实验室的技术积累基础之上,在"银行票据OCR系统中的成套关键技术"的国家863项目的支持下,对银行票据OCR系统系统中的关键技术进行研究和改进,从而提高系统的整体性能.该文主要开展了以下几方面的研究.银行票据中的待识别文字既可能是印刷体文字,也可能是手写体文字,为了获得高精度识别结果,需要把两种文字区分开.该文从特征提取,特征选择和分类器设计等方面对该问题进行分析,用贝叶斯分类器和神经网络设计了两种字体判断方法.当训练样本充足时,用神经网络正确率可达到99.5﹪,拒识率为3﹪时,错误率即可降低到接近0的程度.当训练样本很少时,用贝叶斯分类器,6个训练样本的正确率可以达到89.96﹪,99个训练样本的正确率为98.59﹪.为了处理银行票据中不同识别域的二值化问题,该文从对知识的获取和利用的角度讨论选择和构造二值化方法的思路,并针对各类识别域具体构造了一整套二值化方法.文字切分不仅是票据识别系统中的重要关键技术,也是其它所有脱机文字识别技术实用化的瓶颈.该文的文字切分方法主要有以下三个特点:(1)切分之前先提取候选切分位置.(2)采用贝叶斯分类器确定最佳候选切分边界.(3)结合文字识别结果切分文字.在银行票据OCR中的许多关键技术都和文字识别结果可信度相关.该文提出一种新的基于支持向量机的易混淆字判别和可信度估计方法,该方法适用于任何种类的分类器.
其他文献
本文首先对传统的波束形成算法作了一个简单的回顾,然后重点介绍了利用信号确定性的恒模算法,同时也介绍了利用信号的非高斯性质的高阶累积量算法。然后,采用上述方法对通信信号
随着近年来宽带技术的深入发展,主干网络中迅速由光纤网络取代了传统的网络传输媒介,大大提高了主干网的通信带宽.由于很难控制光子的存储转发,全光交换离现实应用还有一定距
该论文以开发实现基于嵌入式系统的七号信令系统软件为基础,深入研究信令网关技术作为切入点来加入到下一代网络的研究领域当中来.该论文的内容主要由两个部分组成,基于嵌入
该系统通过实验测试,表明该系统具有以下特点: 1、空载时为24V 安全电压。由于采用了直流电源技术,所以在空载时,焊接端的电压为24V 安全电压,避免了触电事故的发生。 2 、
随着移动通信技术的发展,3G技术越来越受到人们的关注.现在主流的3G标准有WCDMA、CDMA2000和TD-SCDMA,用的比较多、技术也比较成熟的要数WCDMA标准.UMTS(通用移动通信系统)正
人类已经进入信息化社会,随着以IP网为基础的Internet在全世界日益普及,政府、军队、企业等部门越来越需要利用网络传输和管理信息.虽然计算机与网络技术为信息的获取、传输
NGN是以软交换为核心的/分层的、业务驱动的电信级可运营的网络;软交换技术是基于业务控制与呼叫控制分离、呼叫控制与承载分离思想,以软件功能来实现硬件交换的技术;两者的
毫米波被动成像技术由于其独特的技术优势,在飞机着陆、机场港口的场面监控、银行、场馆等场所出入口安全检查等领域有着重要的应用。在高性能场景监控等领域需要高质量的成像