论文部分内容阅读
随着计算机技术、信号处理技术和人工智能技术的飞速发展,数字识别技术被广泛应用于日常生活中,是模式识别技术和计算机智能接口技术的重要组成部分。矩作为一种重要的图像分析工具,因其良好的不变性特征,在计算机视觉及模式识别中被广泛采用。本文主要研究了矩技术及其在数字识别中的应用。本文在前人研究的基础上,首先,概述了字符识别技术,介绍了字符识别系统的构成以及发展现状;然后,探讨了规则矩、正交矩以及其它常用矩不变量的定义和性质,并就各种矩在图像表示能力、噪声敏感度和信息冗余度等方面的性能进行了比较与分析;本文还探讨了Pseudo-Zernike矩的特点和性质,证明其对于各种模式的形状描述具有旋转不变性、鲁棒性、信息表达冗余性小、信息表达相关度高、多层次表达、能描述运动图像、便于实现、可用于目标重构能特点以及比例不变性和平移不变性等性质;最后,本文针对Pseudo-Zernike矩的常用算法仅能对正方形图像进行计算的问题,在Chong的算法的基础上,提出了一种直接将矩形图像映射到单位圆内计算Pseudo-Zernike矩的改进算法,无需对图像进行归一化,加快了计算速度,提高了识别精度;进一步,本文将改进算法结合BP神经网络,应用于数字图像的识别和激光防伪标识上数字的识别。结果表明,在计算速度上,采用改进算法比Chong的算法速度提高接近一倍;在训练网络的收敛情况上,针对50幅训练样本,改进算法累计平方误差和为0.14465,较Chong的算法的0.14759更低;在识别精度上,针对50幅识别样本,改进算法识别率为90%,比Chong的算法高出8个百分点。因此,本文提出的Pseudo-Zernike矩的改进算法对数字识别问题是非常有效的。