基于机器学习的电路板印刷字符检测识别方法研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:X22521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习与深度学习的快速发展,在传统的图像处理领域中又带动起了一波新的发展潮流,新的机器学习方法应用于图像文本识别领域的方法研究日趋活跃。同时伴着智能设备的发展,为了适应更快的生产节奏,更高的生产效率,传统的工业生产方式也急需新的技术改革。图像文本识别在工业领域中亦是不可或缺的一员,无论是自动化生产线还是物流运输,处处都需要图像文本识别技术。本文以电路板印刷字符的图像文本识别技术为研究课题,主要研究了工业背景下的图像文本字符区域识别、字符分割、字符识别等,具体内容如下:1)研究了以PCB板为背景的文本准确区域定位方法,在提取候选字符区域方面,传统算法是使用最大稳定极值区域算法然后直接进行字符分割,这种方法在在噪声较多的背景下效果并不理想,本文在使用MSER算法后将极大值区域进行形态学处理,并提出一种自设规则过滤器,根据文本区域特征筛选掉大部分的非文本区域,然后提取训练样本的HOG特征,对样本进行训练,使用SVM分类器实现候选区域准确定位。并统计分析了测试用例的准确率和可行性。2)研究了字符精准分割方法,为了能够更加准确的将文本区域中的每一个字符分割出来,获得比传统方法更好的分割准确率,结合样本的实际特征,在基于垂直投影法的基础上与先验知识相结合,获得了更为准确的字符起始位置和终点位置的坐标,分割出来的字符更加准确,无多余的空白区域。并统计分析了测试用例的准确率与分割失败样本的原因。3)研究了基于KNN字符识别方法,在提取字符特征时,为了获得更多的优秀特征,减少后期的训练样本数量,使提取的特征更为直观,在此提出了一种组合特征提取,在基于轮廓特征的基础上加入了结构特征与密度特征,相互结合,从而组成一种新的组合特征提取。利用所获取的特征,对样本进行训练,使用了KNN分类器进行字符识别。最后统计了识别的准确率。综上所述,本文通过上述的方法与改进实现了工业背景下的图像文本识别,并取得较好的效果,证实本文所设计方案的可行性与实用价值。
其他文献
凡是与农业有关的词汇都可称为农业词汇,本课题只涉及侗泰民族传统农业的词汇。侗泰都是从事传统农业的民族,传统农业是指在自然经济条件下,采用人力、畜力、手工工具、铁器
结合环境影响评价工作实践,依据大气现行导则,收集研究对象现状调查资料,从引用大气现状监测数据的时间、距离、方位、敏感点分布情况等方面进行数据有效性分析,在此基础上,
近年来,人群中心血管疾病的患病率逐年上升。但其危险因素多而复杂,没有一个系统的,综合的定论,本研究针对餐后血糖高值及血压、血脂异常者患心血管病的发病危险及各因素的单
<正>日常中,面对外境做到心不染著相当不易。心猿意马是最形象的比喻,妄念此起彼伏而不自知。佛教教育人们在精神上超越生死与轮回,离苦得乐。面对"脱缰之念",什么才是"正行
本文以“汉语方言地图集数据库”930个方言点的178个阳声韵字为研究对象,归纳以《切韵》音系为代表的中古阳声韵韵尾在现代汉语方言中的读音类型,分析阳声韵九摄的演变情况,
壮、泰语中的副词既有差别又有共同点,本文运用对比语言学、文化语言学和统计学的理论和方法对壮语和泰语的副词进行本体对比研究,并分析其异同的成因。全文分为三章:第一章,绪论
我国家庭社会学界很早就对养老问题给予了关注和研究,这些家庭社会学的研究主要从代际关系、家庭规模、家庭结构等角度对老年人生活的现状、成因、变动趋势进行了一定的探讨
人脸识别技术作为图像识别技术的具体应用,已经成为模式识别领域研究的热点,目前该领域已取得了许多成果。同时人脸验证和性别识别作为人脸识别领域的重要分支,近年来也取得
随着佛教众多教派的出现,寺院教育逐渐形成体系。教育理念、教学方式、教学内容、考试制度等都在不断完善且形成了固定模式,最终孕育出青藏高原独具特色的寺院教育,对藏区文
目的探讨辅助生育技术中,影响冻融胚胎移植结局的相关因素。方法回顾性分析103个冻融胚胎移植周期,探讨其与胚胎移植妊娠结局的关系。结果三种不同方式准备子宫内膜,对妊娠率