一种改进的自适应增值税发票字符识别方法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:chengyihan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“营改增”税改在全国各行各业展开,增值税发票的验真变得越来越广泛和重要。由于供应商进项发票可以成为抵扣税的凭据,直接关系到采购企业的经济利益。为了提高增值税发票认证的效率,研究利用计算机来自动识别增值税发票的关键信息具有重要而实际的意义。根据增值税发票的特点和识别的技术要求,构建了增值税发票字符识别的总体技术框架,详细阐述了字符识别的流程和主要技术。通过研读相关技术文献,对OCR的发展状况和相关技术进行了较深的研究分析和归纳。分析了几种常用的灰度图像二值化方法,本文选用了适应性广的局部动态阈值Bernsen算法对图像进行二值化;采用霍夫变换检测发票图像中的直线,从而得出倾斜角并将图像旋转校正;设计了一种以数学形态学为基础的颗粒噪声去除方法;利用了投影法对数字字符进行切分;提取了数字字符图像的网格特征和横向及纵向笔画交点数特征,组成了40维的特征向量。为了达到增值税发票高识别率的要求,本文设计了改进的遗传BP神经网络数字字符识别算法。研究了遗传算法和BP神经网络的基本理论,分析了两种算法各自的长处和短处,利用遗传算法去搜索BP神经网络的一组次优的连接权系数和阈值的初始值,可以很好地综合遗传算法优秀的全局寻优能力和BP神经网络良好的局部寻优能力,从而改善了BP神经网络可能落入局部极值的缺陷,增强了算法的可靠性。标准遗传算法存在缺陷,常常过快收敛而落入局部最优解,搜索没有方向性。这些缺点都和标准遗传算法采用不会随着种群环境的变化而变动的交叉和变异概率有直接关系。为了克服这些缺点,本文设计了一种改进的自适应遗传算法,在定义了种群收敛系数的基础上,设计了一种新的自适应交叉和变异概率调节公式,使得交叉和变异概率能够随着种群收敛性变化而自适应的改变,能够改善标准遗传算法过早收敛的缺陷,改善了遗传算法的全局搜索最优解的能力。设计了一种BP神经网络,综合改进的自适应遗传算法与BP神经网络,利用自适应遗传算法去搜索BP神经网络的一组次优的连接权值和阈值,然后再利用BP网络继续训练,使样本全局误差达到预设的误差限值以下,这种结合的算法可以改善BP神经网络可能落入局部最优的缺陷。在VS2010中,结合OpenCV,用C语言编码实现了本文算法,实验表明本文改进的自适应遗传算法具有一定的优势,改进自适应遗传BP神经网络算法具有健壮性和有效性。
其他文献
五四运动时期(1917-1927),随着新文化启蒙思潮的推进,翻译活动在我国达到新的高潮,此时的学者大都身兼两职,既是文学创作者,也是翻译家。由于渴望推翻旧的文化和文学,建立新
旋挖钻机是用于桩基础工程中成孔作业的机电液一体化大型机械装备,其主卷扬上提和下放过程中存在大量的能量损失。本文针对减少旋挖钻机主卷扬液压系统压力损失及势能回收利
数学问题来源于生活,又应用于生活中。数学家华罗庚曾经说过:宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,日用之繁,无处不用数学。这是对数学与生活的精彩描述。新修订的《小学数
城市管理与行政执法部门是城市管理的主导力量,在规范城市管理、改善市容市貌、提高城市文明程度、塑造城市形象、促进城市发展方面起着重要作用。随着城管执法工作在城市管理
订阅:各地经管、农技站,邮政局,可以破季、破月订阅,也可以汇款给本社发行部征订。每期1.5元,全年24期,共计36元,邮局订阅代号:24-1批发零售:本社发行部,邮局零售网
期刊
教学中,我们要关注学生的生活经验和学习体验,捕捉贴近学生的生活素材,选取学生生活中熟悉的人,事,物,采撷生活中的数学实例,挖掘生活中的数学原型,让学生体会到生动有趣
菲茨杰拉德引领的爵士时代离我们已然有近百年的时间,回首人才辈出的二十世纪美国文坛,无论从文学还是社会风尚来看,都是一个不容忽视的繁荣时代。直到今天,菲茨杰拉德仍以他作品
20世纪70年代,建筑节能概念被正式提出。建筑节能的核心是减少建筑耗能,提高建筑中的能源利用效率。时隔30年,石油与能源问题再次上升为“国际事件”,特别是在我国,能源问题更是显
我社与北京阳光佳艺影税有限公司联合推出农业新技术VCD光盘的邮购业务。这套光盘,共分种植、养殖、防治、加工等几大类,共150多种。系统介绍了包括新,特、优、稀品种的各种
员工是企业的核心,企业创新归根结底就是员工创新,促进员工的创新行为,提高企业的绩效是企业迅速发展的重中之重,而企业中高质量领导方式是推动员工创新行为的关键因素之一。