论文部分内容阅读
机器学习与深度学习的快速发展,在传统的图像处理领域中又带动起了一波新的发展潮流,新的机器学习方法应用于图像文本识别领域的方法研究日趋活跃。同时伴着智能设备的发展,为了适应更快的生产节奏,更高的生产效率,传统的工业生产方式也急需新的技术改革。图像文本识别在工业领域中亦是不可或缺的一员,无论是自动化生产线还是物流运输,处处都需要图像文本识别技术。本文以电路板印刷字符的图像文本识别技术为研究课题,主要研究了工业背景下的图像文本字符区域识别、字符分割、字符识别等,具体内容如下:1)研究了以PCB板为背景的文本准确区域定位方法,在提取候选字符区域方面,传统算法是使用最大稳定极值区域算法然后直接进行字符分割,这种方法在在噪声较多的背景下效果并不理想,本文在使用MSER算法后将极大值区域进行形态学处理,并提出一种自设规则过滤器,根据文本区域特征筛选掉大部分的非文本区域,然后提取训练样本的HOG特征,对样本进行训练,使用SVM分类器实现候选区域准确定位。并统计分析了测试用例的准确率和可行性。2)研究了字符精准分割方法,为了能够更加准确的将文本区域中的每一个字符分割出来,获得比传统方法更好的分割准确率,结合样本的实际特征,在基于垂直投影法的基础上与先验知识相结合,获得了更为准确的字符起始位置和终点位置的坐标,分割出来的字符更加准确,无多余的空白区域。并统计分析了测试用例的准确率与分割失败样本的原因。3)研究了基于KNN字符识别方法,在提取字符特征时,为了获得更多的优秀特征,减少后期的训练样本数量,使提取的特征更为直观,在此提出了一种组合特征提取,在基于轮廓特征的基础上加入了结构特征与密度特征,相互结合,从而组成一种新的组合特征提取。利用所获取的特征,对样本进行训练,使用了KNN分类器进行字符识别。最后统计了识别的准确率。综上所述,本文通过上述的方法与改进实现了工业背景下的图像文本识别,并取得较好的效果,证实本文所设计方案的可行性与实用价值。