银行支票中非金额打印体汉字串识别

被引量 : 0次 | 上传用户:zwxcatcat111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
打印体汉字串识别研究不仅有助于进一步提高金融票据识别系统的自动化处理程度,而且有利于将打印体汉字串识别在金融票据识别中推向实用,具有其广阔的应用前景,是一个非常有研究价值的课题。本文以建设银行支票中非金额打印体汉字串为研究对象,针对预处理、分割、识别和后处理中的一些核心技术进行探讨和研究,并给出具体有效的解决方法,取得了一定的成果。对采集的彩色图像进行灰度化处理,针对支票图像中存在红色印章的情况,提出了有效的灰度化处理策略。首先,判断汉字串颜色(红、蓝、黑);其次,对于蓝色和黑色的汉字串图像,提出了在保留汉字串区域信息的基础上去除章印影响的算法,对于红色汉字串图像,志于解决汉字串和印章之间存在明显间隙的情况,先采用加权平均法对彩色图像直接进行灰度化,再基于二值图像的灰度投影寻找一块空白区域将汉字串和印章分开,从而消除印章的影响。对汉字串倾斜校正,在汉字串打印的时候常会出现倾斜的情况,为了便于在后续分割和特征提取,需要对其进行旋转矫正。对于倾斜角的计算,首先采用直线拟合的方法,该方法可解决大部分的倾斜情况,对剩余汉字串不是整体倾斜的情况,本文提出了分段折线拟合进行矫正的方法。两种校正方法相结合取得了理想的校正效果。对单个字符识别,首先采用最近邻方法将类中心用于汉字一级粗分类来提高汉字识别速度;其次探讨采用了改进的最近邻分类器对字符进行二级细分类。实验表明,此方法相比于直接采用近邻方法,其识别速度和识别率都有了显著的提高。对识别后处理,采用了基于统计的N-gram语言模型和单字识别器相结合的汉字识别后处理方法;针对识别对象的特殊性,本文提出了基于汉字串查找匹配的识别后处理方法。最后将两种后处理方法相结合,用15099个样本进行测试,整串识别率为86.72%。
其他文献
根据长江中游的实际特点,选择汊点分组解法求解河网矩阵方程,克服大型复杂区域内模型计算速度和整体性之间的矛盾。选择水文学-水力学模拟技术相耦合的集成措施,解决洪水调度
采用9月分旬蓄水的方式,可以较好地应对三峡水库汛后提前蓄水时特大洪水的可能威胁。但随着水库运用时间的增加,泥沙淤积将造成大量库容损失,9月分旬控制水位确定时必须要考虑泥
在Incoloy82 5 / 16MnR复合板焊接过程中 ,选用HlCr2 4Ni13作为过渡层焊丝 ,研究了焊接接头的弯曲性能、拉伸强度、主要化学元素在焊缝中的扩散程度及其微观组织。结果表明 ,
从大多数国家经济发展的历史来看,经济增长与就业增长一般存在着正相关关系。改革开放以来,我国经济增长一直保持着强劲势头,年均增长率超过9%,而且这种强劲势头还将持续一段
“解放之战”中“解放”有两个维度:一是文艺从霸权或其他领域的影响中自我解放;二是解放,或者说在审美领域获得解放。而后现代主义正是文学和艺术在这场解放之战中的“惨胜
盈余管理的实证研究起源于西方,但是随着我国经济的快速发展,基于我国资本市场的大环境下的盈余管理实证研究引起了许多学者的研究兴趣,盈余管理由于是运用法律法规的漏洞及
本文主要分析了新医改形势下公立医院人力资源管理中的不足,并提出优化人力资源管理的对策,期望能够为公立医院人力资源管理水平的提升做出应有的贡献。
如果问高考中哪一道题能引来众多人关注的目光,回答应当是作文;如果问高考中哪一道题能占据该卷总分40%的份额,独享“天下第一题”的美誉,回答应当还是作文;如果再问高考考题中唯一
在我国司法实践中,通常以《中华人民共和国合同法》第五十二条第(五)项的规定,来作为认定合同无效的一般性规定。后最高人民法院出台《关于适用<中华人民共和国合同法>若干问
近年来,随着信息经济学、新制度经济学的逐渐兴起和壮大,信用在市场经济体制下发挥着越来越重要的作用,相伴而生的信用缺失问题也成为许多学者亟欲解决的一大难题,尤其是税收