基于领域自适应的芯片字符检测技术研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:luckylzh_luo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别是受到学术界和工业界重视的技术,需要根据针对性的场景设定和模型设计来解决相关实际问题。芯片字符识别作为字符识别的一种特殊场景,可以解决工业缺陷检测、自动化配装芯片等广泛性的工业问题。早期芯片字符识别方法,例如模板匹配等,只能在固定字体和固定场景发挥效果,但近年来随着深度学习算法的扩展和显卡浮点性能的增加,深度学习模型能够识别更多相似字体和更多场景的芯片,但深度学习模型的高精度基本建立在大量而广泛的字符图片数据集上,而在实际情况中,芯片字符数据集由于受到工厂现场条件限制,采集数据困难,所能采集的图片量不丰富,并且图片清晰度较低,有效样本数非常少,这为通常的模型的训练造成了一定困难。针对以上问题,本文旨在建立一种基于领域自适应的芯片字符识别模型,为以上问题的解决做一些工作。本文的主要工作内容如下:(1)为解决芯片字符位置检测所需样本数量较多,但实际难以提供充足的芯片字符数据的小样本情况,本文基于领域自适应相关算法,将对抗学习方法融合于芯片字符位置检测中,提高了在小样本无监督条件下,芯片字符位置检测算法的检测精度。检测算法充分融合了领域自适应方法的优势,将源域数据作为基础对目标域数据进行优化。同时,本文为使检测算法在工业芯片上取得更好的应用效果,对图片的分割提出了针对性的解决方案。(2)为解决芯片字符识别在实际情况下数据集难以标注,且数据质量差的小样本无监督问题,本文建立一种字符识别模型,在目标数据集难获得且数量较少的情况下仍有较好的芯片字符识别效果。本文以衡量域间距离的损失函数和梯度翻转层为基础,以注意力机制的权重矩阵和分类器输出为区分方式,将多维度的特征图像分层次放入不同的域判别器中,减少了负迁移的现象,增强了识别精度。(3)基于以上工作,本文设计实现了基于领域自适应的芯片字符识别系统,并在工业芯片字符数据集上进行了测试和验证。该系统在一定程度上解决了工业生产线芯片检测图像采集模糊、数据量较少但要求较好检测精度的问题,同时减少人工分拣芯片的人力损耗。
其他文献
轻质高强结构功能一体化复合材料的应用范围和使用比例,是衡量未来飞行器先进性的重要指标之一。石墨烯和碳纳米管因其优异的力-热-电-磁等特性,作为一种极富潜力的树脂增强体,被广泛应用于新型多功能纳米树脂复合材料研制。3D编织复合材料是纺织复合材料的典型结构形式,其结构整体性好,能克服传统层合结构易分层的致命弱点,具有优异的综合力学性能。本研究采用石墨烯纳米片和碳纳米管作为纳米增强体,形成石墨烯纳米片/
近年来,不管是在现代军用还是民用领域中,无人机(Unmanned Aerial Vehicle,UAV)使用的卫星导航系统多是采用GPS(Global Position System)与INS(Inertial Navigation System)组合形式,这在全球导航卫星系统GNSS(Global Navigation Satellite System)中使用率是较高的,具备良好的自导性和抗干扰
自从计算机问世以来,如何更好的进行人机交互一直是人们关注的话题,对话系统能够让机器像人类一样使用自然语言与人类交流,任务型对话系统旨在帮助用户完成特定的任务。传统方法构造的对话系统难以在数据集匮乏的场景下具备良好的性能,无法适应对话场景变化且无法回答常见问题。任务型对话系统由于能够降低对人力的消耗受到越来越多领域的关注,因此面向领域的任务型对话系统设计与研究具有重要意义。本文的目标是设计并实现适用
随着互联网的高速发展,金融行业的业务模式也随之发生着改变。为了更好地满足年轻代的用户需求,传统金融行业巨头纷纷进军互联网投资理财领域,互联网催生了诸如东方财富、同花顺、雪球财经等互联网证券门户和社区。股民们倾向于在互联网证券社区表达自己对市场的观点,并通过各种互联网渠道搜索信息制定交易策略,产生了海量观点鲜明的文本数据。研究对金融文本数据的分析方法具有重要的商业价值。本文在研究金融文本分析方面做了
近年来,随着人工智能和计算机视觉的飞速发展,图像补全已成为重要的研究领域,被广泛应用于摄影、安防、医学等各个行业。传统的图像补全算法在实际应用中效果并不理想。随着近几年深度学习在图像处理领域不断取得显著成果,生成对抗网络(Generative Adversarial Networks,GAN)凭借强大的特征表达和学习能力逐渐替代了基于像素扩散和基于补丁块类的传统图像补全算法。本文分析国内外图像补全
滴滴等网约车已成为人们出行的主要方式之一,保障司乘安全、减少交通事故是所有网约车平台的核心关注点,疲劳驾驶、分心驾驶等异常驾驶行为是引发交通事故的重要因素。目前,网约车平台避免疲劳驾驶的解决方案主要是对驾驶员的驾驶时长计时,超过指定的时间后就停止给驾驶员派单。这种一刀切的解决方案,没有根据每个驾驶员的具体情况而制定不同的监管措施,而对于分心驾驶,此类平台目前未采取有效的措施进行监管。针对上述问题,
随着互联网的快速发展,网络中涌现出大量的匿名文本,这些匿名文本中不乏充斥着虚假信息、诈骗信息、甚至是危害国家安全的谣言信息。特别地,暗网因其与生俱来隐匿性,已经成为不法分子犯罪的理想场所。文本作者识别技术可以较好的发现并追踪网络文本的作者,从而打击、预防网络犯罪,维护网络环境的健康安全。现有的文本作者识别技术针对网络文本进行作者识别,其准确率及可靠性较低,且在文本特征筛选过程中人工参与度较高。因此
医学图像分割在定量分析、临床诊断和治疗过程中扮演着重要角色,基于编解码器架构的分割模型被广泛应用到医学图像分割中。在实际分割中,由于编解码器架构的编码器、跳跃连接、解码器组件的设计不合理,会导致出现多尺度特征融合不当、相似特征不相关、特征通道直接拼接引起语义鸿沟、上采样过程抽象特征丢失而利用不充分以及网络参数量冗余问题。这些问题是医学图像分割中的重大阻碍,本论文针对编解码器架构在分割中关键技术进行
磁共振成像(Magnetic Resonance Imaging,MRI)技术自1973年成功显示图像以来得到了迅速发展,已成为最有价值和应用最广泛的诊断成像方式之一。核磁共振系统对于接收线圈的信噪比具有较高的要求,高温超导技术对于高灵敏度的接收核磁共振模拟通路的研制具有重大意义。本文以利用高温超导薄膜材料研制了在1.5T磁场中、63.5MHz的频段研制了一款高温超导核磁共振接收模拟通路,其结构主
深度学习技术的飞速发展,催生出了一系列诸如计算机视觉,自然语言处理,强化学习之类的实际应用场景及方向,同时在安防监控领域也借助深度学习的发展迎来了技术手段上的变革。但是当前应用于安防监控领域的深度学习算法大多只停留在实验室阶段,虽然针对常用的数据集,当前的算法都能取得一个较好的精度,但在真实场景下,算法的精度和实时性能都不能达到实际应用的要求,所以急需一套智能化人体行为检测系统去解决当前真实场景下