基于Adaboost算法的数字识别技术的研究与应用

被引量 : 22次 | 上传用户:shyibow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展、模式识别技术的进步,用计算机处理日常工作中使用的大量票据和表单成为可能,这就是我们通常所说的OCR(光学字符识别)技术。在OCR技术中,手写体数字识别是一个特别的问题,在邮件的自动分拣、工商财务报表的自动录入、考试的自动化报名系统中,都有着广泛的应用背景。 Adaboost算法的基本思想就是,找出若干个、精度比随机预测略高的弱规则,再将这些弱规则组合成一个高精度的强规则。这个算法思想起源于Valiant提出的PAC学习模型,而且Kearns和Valiant证明,只要有足够多的数据,弱学习算法就能够通过集成的方式,生成任意高精度的估计。本文对Adaboost算法进行了研究,并在很多方面对其进行了改进,使其更加适用于数字识别领域。本文的主要工作是:构建了两级分类器结构,使得经典的二分类Adaboost算法不需要做出巨大的改动就可以应用到多分类问题,保持了特征易提取、弱分类器简单的特性;在两级分类器的第一级分类器中,将最后的输出值域由{O,1)改进为[0,1],并据此提出类别隶属度的概念;增加了新的矩形特征形态,并通过实验确定了适合于数字识别使用的矩形特征(形态、个数等)。通过对Adaboost算法的改进,本文中实现的数字识别子系统具有较高的识别率,并且在训练效率和对硬件的要求上比其他优秀的方法更具有优势。 本文还实现了一个医院病案质量评审系统,将基于Adaboost的数字识别算法应用到了实际的系统中,同时解决了一些OCR识别软件中常见的图像处理问题。本系统制定了适合OCR高速文档扫描、识别使用的票面规则,使得对票面中各种信息块的定位、识别更加简单和具有鲁棒性;利用积分图像这个工具,实现了一种高效而稳定的定位块识别算法;为了使数字识别系统更具有实用性,提出了用开闭算法结合Adaboost算法的方案,减少了产生识别错误的风险。
其他文献
【正】 1.在中国由计划经济向市场经济的历史性转变中,中国工会也面临着严峻的历史性转变,即面临着从社会主义计划经济条件下的工会运动向社会主义市场经济下的工会运动的转
针对少数厂家对电热锅炉配套使用的金属管状电热元件了解不深,甚至在使用过程中出现一些误区等问题,介绍相关计算公式、产品系列,结合笔者工作经验,分析使用中出现误区的因果
1 前言随着国家电力工业的迅速发展和城市对环保要求的提高,工业锅炉的使用也在发生着一定的变化.由于电热锅炉与其它锅炉相比,有其优越性,因而该产品发展迅速,社会需求量较
<正>近日,辽宁省卫生计生委公布16家省属公立医院2016年1-6月相关医疗费用控制重点监测指标。指标显示,医疗费用增长幅度平均为15.93%,高于2015年该省平均水平(增长率为9.14%
目的:分析外科手术矫治肥厚型梗阻性心肌病(HOCM)患者围术期心律失常特点及治疗策略。方法:1996-10至2009-12,76例患者因HOCM经常规主动脉切口行室间隔心肌切除术。术前主要
本文以《简爱》的女主人公简.爱为分析对象,总述成书的时代背景、作者情况,以及作者的个人生平与主人公塑造之间的关系,并分别从盖茨海德、洛伍德、桑菲尔德、乡村小学及重回
密达粒剂对棉花蔬菜蜗牛的防治效果韩丽娟许小龙王强顾中言黄祥麟(江苏省农业科学院植物保护研究所南京210014)蜗牛是旱作物田的重要有害生物,主要在棉花苗期和蔬菜整个生长期间为害,影
肺癌是最常见的恶性肿瘤之一,在我国,死亡率已居恶性肿瘤之首。中医及中西医结合治疗肺癌是我国的特色,体现了中医药卓越的优势。本研究采用前瞻性和回顾性相结合的研究方法,
疯癫是精神和思维紊乱的外在行为,在文化意义上意味着偏离理性的轨道或因理性的缺席而表现的言行怪诞。它作为人类社会生活中的特殊形态,不仅引起了医学家们的关注,而且也激发了
保障性住房是我国城镇住宅中的重要组成部分,目前保障性住房中存在着供给不足、需求旺盛、房屋质量不高等问题,这些问题如果仅仅依靠政府职能部门的力量解决,显然是不够的,本