基于手写体数字识别的信息录入与处理系统

被引量 : 0次 | 上传用户:wushiguo208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体数字识别是信息录入的关键步骤,广泛应用于公安、税务、交通、金融等行业的实践活动中。虽然识别方法多种多样,但是目前技术尚不能使识别率达到100%。为了能够将手写体数字识别真正应用到实际工作中,本文除了在手写体识别算法的识别率提高上下功夫之外,还设计了一个基于手写体数字识别的信息录入与处理系统。手写体数字识别的主要难点在于手写体数字字形小,特征信息量少,不同的人群书写习惯不同造成数字的形态千变万化;在某些应用中对于单字识别来说,手写体数字的正确识别要比其他字符严格得多。在对手写体数字识别技术做了充分比较后,本文选择了BP神经网络算法作为识别算法。BP网络实质上实现了一个从输入到输出的映射,理论上它具有实现任何复杂的非线性映射的能力,适合于求解内部机制复杂的问题。BP神经网络的识别效果还依赖于训练神经网络样本集合的质量。为了获得识别率高、误识率低的分类神经网络,本文采集了不同人群中的5万余个有代表性的手写体数字图像作为训练、测试样本。有了这些样本以后,我们对样本图像作了二值化、去噪声、纠偏、细化、定位分割、尺寸归一化等一系列处理,经过这些处理后的单个字符图像被离散成神经网络的输入样本。将样本划分为训练集和测试集,对神经网络进行训练,所得到的神经网络能够达到较满意识别效果。其中,我在处理数字样本的时候发现,某些样本是对神经网络有害的‘坏’样本,在研究中我尝试将这些坏样本‘剔除’以后发现神经网络的识别率和拒识率有所提高、误识率明显下降。将手写体数字识别技术投入实际应用中是我们的最终目标,为此本文设计了一个基于手写体数字识别的信息录入与处理系统,此系统可以混合处理照片、文字(仅保存图像)、OMR以及手写体数字,本文仅重点研究及介绍其中的手写体数字识别模块。系统使用扫描仪将信息卡内容扫描到计算机中以后,程序对手写体数字图像进行二值化、去噪声等预处理,然后形成神经网络分类模型的输入,并由神经网络进行识别。识别后的结果会显示在计算机终端上,并由操作人员对拒识字符进行处理。考虑到识别算法可能有误识别的情况,本文设计了一种批量校对的方法来处理可能发生的误识。经过测试,BP神经网络手写体数字识别算法识别率可达到96.8%以上、拒识率小于2.7%、误识率小于0.5%;在实际系统应用中,批量手写体数字校对方式可以成倍提高误识校正的速度,熟练操作者的处理速度可以达到100字符/秒甚至更高,经过人工干预后,最终误识率小于万分之一。本文主要贡献如下:(1)实现了BP神经网络的训练和识别算法,并在实际工作中得到应用。(2)发现了‘坏’样本对BP网络识别效果的影响,给出了‘坏’样本的判定方法。(3)设计实现了识别结果的批量校对软件,提高了误识字符校对的效率。在以后的工作中,我还会在快速神经网络算法、神经网络集成和图像预处理等技术上多下功夫,争取为神经网络和手写体数字识别的应用和推广做出贡献。
其他文献
本文简要回顾非线性抛物型方程差分方法若干研究工作,包括周毓麟先生在该研究方向取得的部分研究成果,并对近年来相关的部分研究进展进行综述,展望拟开展的研究工作.
目的研究CD20阳性的恶性淋巴瘤患者利妥昔单抗(美罗华)靶向治疗加抗病毒治疗对乙肝病毒再激活的疗效。方法选取2009年1月~2011年10月我院确诊的CD20阳性的B细胞淋巴瘤并且HBsA
目的探索辽宁省锦州市肾综合征出血热(HFRS)流行规律,为制定有效防制策略提供依据。方法采用描述流行病学方法分析HFRS疫情。结果 1982—2012年锦州市累计报告HFRS病例5142例
装备制造业成为上海建设“四个中心”的重要产业支撑。现代光学制造企业的研发工作是企业重要的命脉,研发成本的管控体系的建立,不但可以减少研发过程中成本浪费,更能提升研
本文通过对渭南市临渭区渭北区域葡萄种植、销售的现状及该地区葡萄产业销售情况与发展进行分析,发现制约葡萄销售存在的问题,并针对主要问题提出相应对策。
近年来,随着一线城市定位提升、结构优化和功能疏解,新一线城市全面崛起和二三线城市发展加速,规模经济和范围经济效应显现.作为城市经济活跃程度的两大显性因素,酒店与会展
<正>每一种文化都有自己长期形成的独特历史,有着与环境相匹配的独特价值,不同文化形态在价值上是平等的、多元的、相对的、不可比较的,它们之间不存在先进和落后、高级和低
<正> 患者,男,58岁。因皮肤发黄,间断性右上腹痛20天来院就诊。临床以胆囊癌?收住院。患者于20天前无明显诱因出现上腹部胀痛,呈持续性,并向他处放射,伴全身不适,食欲不振,精
闪光式电子供油、点火提前角检测仪的研制,是山西农机新技术服务中心根据生产实际需要提出的科研项目,1991年被列为农业部“八五”期间重点科研项目,1994年通过农业部组织的科研项目验收
近年来,计算机网络犯罪案件急剧上升,计算机网络犯罪已经成为普遍的国际性问题。而打击计算机网络犯罪的关键是找到充分、可靠、具有法律效力的电子证据。因此,计算机取证(co