基于自编码和知识蒸馏的表面缺陷检测方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:LINGBAOLAOLI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的表面缺陷检测方法只能对具有高对比度或低噪声的明显缺陷轮廓进行检测的问题,提出了一种基于自编码和知识蒸馏的表面缺陷检测方法来准确定位和分类从实际工业环境捕获的输入图像中出现的缺陷.首先,设计了一种级联自动编码器(CAE)架构用于分割和定位缺陷,其目的是将输入的原始图像转换为基于CAE的预测蒙版;其次,利用阈值模块对预测结果进行二值化以获得准确的缺陷轮廓;然后,把缺陷区域检测器提取并裁剪出来的缺陷区域视为下一个模块的输入;最后,将CAE分割结果的缺陷区域通过知识蒸馏进行类别分类.实验结果表明,与其他几种表面缺陷检测方法相比,所提出的方法综合性能最好,其缺陷检测平均准确率为97.00%.该方法能够有效地对较小的、边缘不清晰的缺陷进行分割,满足对物品表面缺陷实时分割检测的工程要求.
其他文献
针对低资源语言机器翻译任务上一直存在的标注数据资源匮乏问题,提出了基于语种相似性挖掘的神经机器翻译语料库扩充方法.首先,将维吾尔语和哈萨克语作为相似语言对并将其语料进行混合;然后,对混合后的语料分别进行字节对编码(BPE)处理、音节切分处理以及基于音节切分的BPE处理,从而深度挖掘哈语和维语的相似性;最后,引入“开始-中部-结束(BME)”序列标注方法对语料中已切分完成的音节进行标注,以消除音节输入所带来的一些歧义.在CWMT2015维汉平行语料和哈汉平行语料上的实验结果表明,所提方法相较于不进行特殊语料
域自适应的目的是利用有标记(源)域中的信息来提高未标记(目标)域模型的分类性能,且这种方法已经取得了不错的成果.然而在具有开放性的现实场景下,目标域通常包含源域中未观察到的未知类样本,这被称为开放集域自适应问题.传统的域自适应算法对这样具有挑战性的场景设定无能为力,因此提出了渐进式分离的开放集模糊域自适应算法.首先,基于引进隶属度的开放集模糊域自适应算法,探索了逐步分离目标域中已知类和未知类样本的方法;然后,仅将从目标域中分离出的已知类与源域对齐,从而减小两个域之间的分布差异,进行模糊域自适应.所提算法很
很多传统社区检测方法大多局限于单关系网络,适用性和准确性均较弱.针对此问题,提出了一种针对多关系网络的社区检测方法.首先,为进行多关系网络建模,使用了三阶邻接张量,其中张量的每个切片表示与参与者之间一种类型的关系相对应的邻接矩阵.从数据表示的角度,将多关系网络解读为三阶张量利于将因子分解方法作为学习方法使用.然后,应用RESCAL分解作为关系学习的工具,从而揭示参与者的唯一隐性表征.最后,在上一步得到的结果上应用进化K均值聚类算法,以确定多维度上的社区结构.在一个合成数据集和两个公开数据集上进行实验.实验
文本特征是自然语言处理中的关键部分.针对目前文本特征的高维性和稀疏性问题,提出了一种基于Word2Vec词嵌入和高维生物基因选择遗传算法(GARBO)的文本特征选择方法,从而便于后续文本分类任务.首先,优化数据输入形式,使用Word2Vec词嵌入方法将文本转变成类似基因表示的词向量;然后,将高维词向量模拟基因表达方式进行迭代进化;最后,使用随机森林分类器对特征选择后的文本进行分类.使用中文评论数据集对所提出的方法进行实验,实验结果表明了优化后的GARBO特征选择方法在文本特征选择上的有效性,该方法成功地将
针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型.首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接着,在注意力层采用过滤机制有效地去除句子中的噪声,从而更好地得到问句和答案句的句子表征;其次,在匹配层同时引入多种匹配策略来完成句子向量之间的信息交互;然后,利用双向长短期记忆(BiLSTM)网络对匹配层输出的句子向量进行拼接;最后,通过分类器来计算拼接向量的相似度大小,从而得
在交互式网络电视(IPTV)应用中,家庭电视终端往往由多名家庭成员共用,现有推荐算法难以从终端历史数据中分析出家庭成员的不同兴趣偏好.为了满足同一终端下不同成员的视频点播需求,提出了一种基于胶囊网络的IPTV视频点播推荐模型CapIPTV.首先,设计了一种基于胶囊网络路由机制的用户兴趣生成层,将终端历史行为数据作为输入,并通过胶囊网络的聚类特性得到不同家庭成员的兴趣表达;其次,利用注意力机制给不同的兴趣表达动态分配注意力权重;最后,提取出不同家庭成员的兴趣向量和点播视频的表示向量,计算两者内积后得出Top
基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为.现有方法多数都是通过对用户会话点击序列的物品信息进行建模,并学习物品的向量表示,进而进行推荐.而作为一种粗粒度的信息,物品的类别信息对物品有聚合作用,可作为物品信息的重要补充.基于此,提出了基于会话的多粒度图神经网络推荐模型(SRMGNN).首先,使用图神经网络(GNN)得到会话序列中的物品和物品类别的嵌入向量表示,并使用注意力网络捕捉用户的注意力信息;然后,将赋予了不同注意力权重值的物品和物品类别信息进行融合后,输入到门限
针对工业机器人机械轴健康管理中检测效率和精准度较低的问题,提出了一种机械轴运行监控大数据背景下的基于动作周期退化相似性度量的健康指标(HI)构建方法,并结合长短时记忆(LSTM)网络进行机器人剩余寿命(RUL)的自动预测.首先,利用MPdist关注机械轴不同动作周期之间子周期序列相似性的特点,并计算正常周期数据与退化周期数据之间的偏离程度,进而构建HI;然后,利用HI集训练LSTM网络模型并建立HI与RUL之间的映射关系;最后,通过MPdist-LSTM混合模型自动计算RUL并适时预警.使用某公司六轴工业
在印刷工业生产中,针对直接使用YOLOv4网络进行印刷缺陷目标检测精度低、所需训练样本数量大的问题,提出了一种基于Siamese-YOLOv4的印刷品缺陷目标检测方法.首先,使用了一种图像分割和随机参数变化的策略对数据集进行增强;然后,在主干网络中增加了孪生相似性检测网络,并在相似性检测网络中引入Mish激活函数来计算出图像块的相似度,在此之后将相似度低于阈值的区域作为缺陷候选区域;最后,训练候选区域图像,从而实现缺陷目标的精确定位与分类.实验结果表明:Siamese-YOLOv4模型的检测精度优于主流的
针对深度卷积生成对抗网络(DCGAN)中的对抗训练缺乏灵活性以及DCGAN所使用的二分类交叉熵损失(BCE loss)函数存在优化不灵活、收敛状态不明确的问题,提出了一种基于仲裁机制的生成对抗网络(GAN)改进算法,即在DCGAN的基础上引入了所提出的仲裁机制.首先,所提改进算法的网络结构由生成器、鉴别器和仲裁器组成;然后,生成器与鉴别器会根据训练规划进行对抗训练,并根据从数据集中感知学习到的特征分别强化生成图像以及辨别图像真伪的能力;其次,由上一轮经过对抗训练的生成器和鉴别器与度量分数计算模块一起组成仲