基于深度学习的小样本图像缺陷检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hyt1217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产品表面自动化缺陷检测对保证产品质量和提高生产效益有着重大的影响。传统手工定制特征的算法具有通用性差,检测精度低,开发成本高等缺点,而深度学习算法具有通用性好,检测精度高,鲁棒性强等优势。在缺陷自动化检测领域,基于深度学习算法正在逐步替代传统的算法。但是在应用过程中会存在缺陷样本量少,图像分辨率高的情况,无法直接使用现有的深度学习算法。针对这些问题,本文开展基于深度学习的缺陷检测算法的研究,重点解决小样本以及高分辨图像的问题。本课题针对小样本集的问题,设计一种基于生成对抗神经网络的缺陷生成算法来扩充数据集。为了提升生成的缺陷样本质量,设计一种基于残差的算法,降低了模型学习的难度,更好地学习缺陷本身的特征。为了大量地扩充多种类型的缺陷,增加样本的多样性,本文利用缺陷区域的掩膜信息,将其作为模型的条件输入,通过控制掩膜的位置大小形状来控制生成的缺陷区域。针对高分辨的图像表面缺陷检测问题,本文设计了一种粗检测—细分割的算法。在粗检测阶段,先用小而精的检测模型来对高分辨图像进行缺陷粗检测,确定缺陷的大致位置,为了减少检测网络的误检率,在不大幅度增加网络层数的情况下,使用空间金字塔池化层(Spatial Pyramid Pooling,SPP)有效增大网络感受野。在细分割阶段,对粗检测阶段的预测区域进行分割,无需处理无缺陷区域。为了提高分割网络的分割精度,使用带空洞卷积的空间金字塔池化层(Atrous Spatial Pyramid Pooling,ASPP)增强网络对不同尺度缺陷的感知能力。同时,使用跳跃连接,将低层次的特征和高层次特征进行融和,再次提高分割的精度。本文通过缺陷生成实验以及在DAGM(Deutsche Arbeitsgemeinschaft für Mustererkennung)等工业数据集上和现有算法以及商业软件的对比实验,验证了算法的有效性以及优越性。通过缺陷生成算法实现数据集的大量扩充,极大地提高检测的精度,并将算法成功落地于工业通用表面缺陷检测领域。粗检测—细分割的检测算法在图像分辨率为512×512的测试图片上达到25 fps;在图像分辨率为2048×2048的测试图片上达到5 fps。在DAGM数据集上,检测精度MIoU达到0.8593。
其他文献
科技的发展推动着社会进入智慧时代,治理主体趋于多元化,治理模式也将发生变革,政府治理方式与治理能力同时面临着机遇和挑战。利用信息进行治理是政府治理能力提升的必然选择,但个人信息保护也是时代发展公民不断上升的权利需求,二者之间产生了一定的冲突。政府利用信息的治理行为类型复杂、收集利用信息的方式不规范及问责机制的不完备是二者冲突的主要原因。但矛盾产生的根本在于信息权这一理论的发展使得国家治理中信息公开
本论文对硅酸盐Ce9.33(SiO4)602、Ce9.33-xTbx(SiO4)6O2晶体与硼酸盐EuxBa1_xB204晶体的原料合成、晶体生长、磁性、光学与磁光性能等方面进行了较为系统的研究。通过高温固
近年来,作为能够有效帮助法官提高工作效率、切实简化司法流程的自动化法律判决预测成为司法人工智能的重要研究方向。自动化法律判决预测旨在将自然语言处理技术应用于司法数据,根据输入案件的案情描述,自动预测被告人的罪名、刑期以及与本案相关的法条和类似案件等。不仅能为司法工作人员提供专业的法律建议,也能为非专业但有需要的人士提供高效廉价的法律咨询服务。关于自动化法律判决预测,以往多数研究不考虑任务之间的内在
钛及钛合金具有良好的化学耐腐蚀性及良好的生物相容性,较低的弹性模量,较高的比强度,引起了较多学者的关注,在医疗骨替换及牙齿等方面具有广泛的前景。钛在自然界的丰度比较高,但因其比较活泼,冶炼加工成本比较高,限制了它的使用。粉末冶金法是获得低成本钛的有效方法。钛在医疗领域用作骨替换材料,但钛及钛合金材料相比骨的弹性模量及抗压强度较高,力学性能不匹配,易造成应力屏蔽从而使植入失效。降低钛的弹性模量使力学
回音壁模式(WGM)光学微腔是一种具有超高品质因子和腔模模式体积极小的新型光学微腔,其具有极高功率密度的WGM可以显著地增强光与物质的相互作用。基于WGM微腔的光学频率梳(O
传递签名是一种能够高效解决图状大数据认证问题的特殊数字签名,在管理域、军事指挥系统、PKI证书链以及电子政务中都具有实际应用价值。传递签名方案中,已知相邻两条边(i,j)
随着视频网站的快速发展,我国互联网视频产业逐渐走向成熟,网络自制节目开始向精致化、品质化和专业化转变。与之前成本低下内容粗糙的网络自制节目相比,随后涌现的优秀节目
微球谐振腔中的耳语回廊模(Whispering gallery mode,WGM)有着模式体积特别小和品质因子特别高(Q=1010)的特点,使得由WGM作为泵浦光场时其功率密度极高(GW/cm2),损耗很小,产
随着人工智能时代的到来,各行各业都掀起了一股人工智能的浪潮。行人检测(Pedestrian Detection)是计算机视觉领域一个重要的研究方向,其作为自动驾驶、智能监控和人机交互系
随着互联网的快速发展,大规模数据的出现,使得用户需花费太多的时间和精力去选择自己需要的信息。社会化推荐为用户提供了便利,但社交网络上存在一些噪音信息而表示学习可以解决推荐算法的可拓展性及抵抗嘈杂数据。基于此,基于网络表示学习的推荐受到了研究者的广泛关注。然而,社交网络过大,难以在有限内存中进行计算。因此,研究一种有效的表示学习方法对提高推荐的准确率非常重要。而聚集图通过空间压缩,保留了关键的结构关