票据自动处理系统中的预处理技术研究

被引量 : 0次 | 上传用户:zgkjzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融票据自动处理系统以其较高的学术价值和应用价值越来越受到国内外众多著名研究机构以及学者的广泛重视。票据图像的预处理是字符识别的前提和基础,预处理效果的好坏将直接影响到系统的整体性能。目前的研究和应用表明,预处理效果的不理想已成为识别错误的主要原因之一。因此研究如何提高预处理后字符图像的质量对于提高系统的整体性能具有极其重要的意义。 本文以金融票据为研究对象,主要对预处理过程中的一些核心技术进行研究和改进,并取得了一定的成果。 针对票据图像中普遍存在的笔画与表格框线交叠的现象,提出了直接利用图像灰度信息的灰值线检测与去除算法。在直线检测过程中设计了灰度图像中的Hough变换来精定位直线的两条边沿;在去直线过程中对边缘特征进行分析,采用基于保护区的策略将线去除。在支票上的试验表明该算法是有效的。 票据图像背景复杂,直接选取阈值比较困难。提出了利用形态学算法检测笔画双边缘的方法以及两种二值化算法:(1)从图像分割的效果评价角度出发,结合字符图像的特点提出了利用递归过程选取阈值的方法。在每一次的递归过程中,由最大方差阈值去除图像中最亮的一类,直到图像中只剩下最黑的一类目标(字符)。(2)通过灰度和双边缘特征分析进行二值化。灰度值描述了像素自身的特性;双边缘描述了像素在局部窗口内的相对特性。通过二维直方图内的投影变换,目标和背景对应的峰更明显,阈值选取变得较容易。采用视觉效果和识别效果两种评价方式与常用的5种文档图像二值化算法进行比较,结果表明了提出的两种算法更有效。 针对票据中大量的数字串填写在定位格内的情况,提出了一种新的数字分割方法。该方法将数字粘连划分为过渡粘连和共用粘连两种方式。对于第一种粘连,首先由上下轮廓差和结构点确定候选分割点,再依据数字的左右边缘差、纵向开口深度和结构点对结果进行修正;对于第二种粘连,则直接依据结构点进行分割。对622个粘连字串的平均分割成功率为92.28%。 最后本文给出了一个基本的后督手写支票自动处理系统,主要对其中的一些图像处理和模式识别技术进行了简单介绍,该系统已经在实践当中得到了使用,取得了良好的效果。
其他文献
本文依据华东师范大学的具体实践,分析了目前高校信息化建设中科研系统财务管理的现状与存在的问题,并详细介绍了财务管理与科研管理融合的规划与实现,以华东师范大学运用Web
在中学语文教学中,作文教学的低效局面由来已久。随着素质教育的日益深入,中学作文教学改革的呼声日益高涨,为改变中学作文教学的现状,有识之士提出了不少改革方案,取得了一定的成
视觉测量技术是机器视觉理论在测量领域的应用,近年来已成为仪器科学中发展十分迅速的重要领域之一。成像标定及图像分析、处理是视觉测量系统的关键环节。摄像机标定为视觉图
本文主要研究怎样运用智能推理型的专家系统实现变电站对变电站内各设备在各种运行方式下进行倒闸操作时,能够正确确定倒闸操作票的步骤,并提供方便的界面供运行操作人员浏览
学位
科技论文承载着科学研究的成果,是科研人员实践工作与思想智慧的结晶。科技论文的传播既是知识的传播,也是科学领域进展的体现,对科技发展与创新具有重要意义。然而,传统的传
随着我国法治建设的步步深入,在法律运行各个环节中暴露出来的“人”的问题越来越严重。这些问题集中地体现在法律运行的最终环节——司法——及其参与人员身上:法官,吃了原告吃
随着我国社会、经济的发展,人们越来越重视生活质量,公众的环保意识不断提高,对大气污染状况和空气质量水平日益关注。并且,我国的环境污染排放总量不断增加,污染范围继续扩大,以颗
糖尿病作为一种终身代谢性疾病,并发症高达一百多种。研究表明,脉冲磁场能促进胶原纤维沉积,改善胶原纤维排列和取向,有助于糖尿病伤口愈合,能有效地促进糖尿病患者的溃疡静
世纪之初,美国在线和时代华纳这两家公司走到了一起,合并成为“美国在线时代华纳”公司。本文分析了合并三年,美国在线时代华纳发展的情况。 在合并的三年时间里,美国在线时代