基于改进YOLO算法的金属表面缺陷检测研究

来源 :五邑大学 | 被引量 : 0次 | 上传用户:harryhexiaoer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金属制品在工业生产过程中,常常会由于各种因素受损,产生缺陷。过去,企业往往采用人工检测的方法进行筛选,该方法工作量大,检测速度慢,无法满足实际需求,而基于机器视觉的表面缺陷检测技术能够克服人工检测的缺点,已成为工业生产线中的关键检测技术。然而,传统机器视觉检测算法步骤繁琐,通用性差,且容易受到光照,阴影等环境条件的影响,其人工设计的特征更是存在着较大的局限性,难以应对复杂多样的金属表面缺陷。随着人工智能技术的蓬勃发展,拥有强大表达能力的深度学习备受关注,采取基于深度学习的方法能够发挥出远超传统检测算法的性能。YOLOv4是业界先进的目标检测算法,取得了精度和速度上的平衡,但其直接应用在金属表面缺陷检测上仍然存在着不足,如:算法的特征提取能力不足,对小目标以及宽高比大的缺陷检测精度有待提高,据此,本文提出了基于改进YOLOv4的金属表面缺陷检测方法,具体研究内容如下:(1)针对多类别缺陷检测进行了优化,提出了第一种改进YOLOv4算法,在综合检测精度上更高。主要有三点改进:在CSPResblock模块中引入SE注意力模块,增强了对金属表面缺陷的特征提取能力,改进空间金字塔池化层,提高了对宽高比大的缺陷的检测效果,融合浅层信息优化PANet结构,改善了对小目标的检测效果。(2)主要针对小目标检测进行了更彻底的优化(仅采用一条浅层输出路线,充分利用浅层信息),提出了第二种改进YOLOv4算法,在对数据集中的小目标检测时精度更高。对小目标的改进措施如下:将网络改为单输出层的结构,且采用浅层特征图作为输出,同时,在分配先验框时,将9个先验框都分配在同一层上,改善对于小目标的检测效果。此外还做了其它优化,采取K-means++聚类先验框,使用CSP残差结构替换五次卷积模块。(3)上述提出的改进模型都具有较大的参数量,容易受到硬件平台的制约,考虑于此,为了压缩模型的大小,对轻量化网络进行了分析研究,首先,分析了Mobilenet和Ghostnet两种轻量化网络,其次,对比了Mobilenetvx(1-3)-YOLOv4,Ghostnet-YOLOv4的检测性能,其中Mobilenetv3-YOLOv4算法表现出了更好的性能,即Mobilenetv3的轻量化方式更适合模型的压缩,最后,以第一种改进算法为例,采取Mobilenetv3轻量化网络的结构对算法进行修改,轻量化后的改进算法在模型参数量上得到了极大的压缩,检测速度也获得了提高,同时还保留着较高的精度。本课题使用了三个数据集,天池铝材缺陷数据集,北京大学PCB缺陷数据集,本课题自行采集的金属导轨缺陷数据集。采取第一种改进YOLOv4算法对铝材十类缺陷进行检测,精度达到79.27%,采取第二种改进YOLOv4算法对PCB小目标缺陷进行检测,精度可达到98.71%,两种改进算法在对本课题采集的金属导轨缺陷检测时,精度分别可达到88.02%和87.25%。特别的,基于Mobilenetv3的改进算法精度为86.46%,FPS为49.01,参数量为43.80MB,牺牲了些许精度,换来了FPS的提升,参数量为原YOLOv4算法的五分之一不到。
其他文献
戏剧是高中语文教学的四大文体之一。戏剧作品可以阅读和表演,不仅可以促进学生的阅读和写作,还可以促进他们的表达和交流。然而,当前我国戏剧教学的现状问题比较突出,既缺乏对戏剧教学的关注,也缺乏对戏剧教学行之有效的实践策略。戏剧的教育功能不能得到充分发挥,其独特的艺术魅力无法得到充分展现,其位置始终处在边缘化状态。本文采用文献分析法、数据统计法、问卷调查法综合分析语用学理论视域下高中语文戏剧教学的必要性
学位
在过去的20年里,人们对教师信念的研究兴趣大增。推动这一研究增加的关键在于人们认识到教师是积极的决策者,在课堂活动中发挥着核心作用,且他们的行为受到教师信念的指导。理解教师信念是理解教学过程的核心,同时可以帮助教师更好地理解自己。目前对教师信念的研究主要集中在在职教师身上,大多数是通过问卷调查进行的定量研究。然而,教师的信念是内隐的、不可言喻的,因而教师的回答不一定是真实的。基于此,本研究采用个案
学位
百年初心历久弥坚,2021年教育部进一步要求将革命传统全面融入中小学课程教材,在《革命传统进中小学课程教材指南》(教材[2021]1号)中明确要求统编本初中语文教材突出加强革命传统教育,厚植红色基因,落实立德树人。初中生正处世界观、价值观、人生观的塑造期,社会经验和认知水平有限,亟需教师引导他们树立正确的是非观,建立起应有的文化认同感及民族使命感。传统的“革命传统”选文教学因时代背景久远、价值潜隐
学位
报纸
本文主要研究了几类非线性复微分差分方程的解.同时给出了相关的例子,进一步说明解的存在性.本文的结构安排如下:第一章是绪论.介绍关于非线性复微分差分方程研究的背景以及现状.第二章是准备工作.主要介绍了Nevanlinna理论等在本文需要用到的基本概念和证明过程中要用到的部分引理.第三章研究了一类非线性微分方程的超越整函数解,得到了定理3.1,推广了柏雪在文献[13]的结果;第四章研究了一类非线性微分
学位
首先,我们从脉冲控制的观点出发,建立关于任意时滞的脉冲微分不等式.其次,利用此不等式与Lyapunov(李雅普诺夫)方法等研究了具有任意时滞的神经网络的脉冲μ-稳定化,以及驱动-响应系统的脉冲μ-同步化.最后,运用矩阵张量技巧和线性矩阵不等式等方法研究了具有任意时滞的复杂网络的脉冲μ-同步化问题.内容如下:第一章,介绍了研究脉冲时滞微分系统的稳定与同步目的与意义及国内外研究现状.第二章,从脉冲控制
学位
本硕士论文主要研究四元数双曲空间的若干性质.我们研究了球模型与Siegel域的极限球面之间的对应关系、两个偏差定理、球模型中极限球与正则域相交的充要条件等内容.本文结构如下:第1章,介绍四元数双曲空间的研究背景.第2章,通过四元数双曲空间的球模型,引入四元数双曲空间的另一模型Siegel域,得到了Siegel域上的Busemann函数与等距球的相关性质.接着在Siegel域上引入极限球坐标与Cyg
学位
众所周知,一个矩阵只有当它是方阵而且非奇异时才有逆矩阵,或者当它的列(或行)是线性无关时才有逆矩阵.而对于任意多个非奇异矩阵Ai,i=1,2,…,n,以下反序律成立:(A1A2…An)-1=An-1..…A2-1A1-1.这种反序律对于任意多个矩阵乘积的广义逆来说不一定成立.20世纪60年代以来,很多学者研究了矩阵乘积广义逆的反序律理论及其应用,其中包括了矩阵乘积Moore-Penrose逆以及D
学位
在近些年来的脑科学的研究当中,关于大脑疲劳形成在背后所蕴藏的神经科学机理,一直是当前的热点研究方向之一,由于驾驶疲劳所导致的交通事故伤亡,引起了人们对驾驶疲劳检测的高度重视,本文针对以往疲劳检测模型中的不足,提出了一种新的基于注意力的多尺度卷积神经网络,即动态图卷积网络(AMCNN-DGCN)模型,该模型能够很好的发挥图卷积对非结构化数据提取特征的能力,并结合动态调整的邻接矩阵,获得更加优异的分类
学位
随着图像处理技术的发展,舌诊客观化成为当今人工智能医工交叉领域的热点内容。为使中医舌诊更加客观定量化,图像处理技术与深度学习已应用于舌诊客观化。因此,基于深度学习的舌诊图像处理方法成为了必然的研究方向。目前,舌诊图像分割分类技术面临着复杂环境下的分割结果不佳,分类标记数据样本不足以及类别不平衡的问题。针对以上舌诊图像分割分类任务中面临的难点问题,本文以深度学习框架为基础,结合编解码网络、注意力机制
学位