面向增强现实应用的轻量级零件识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xuyi50488
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,在工业装配领域中,工人的主要装配指导方式还是基于查阅纸质手册的方式来进行装配过程的指导,这类指导方式通常面临装配效率低,对装配人员的经验要求较高等问题。而增强现实技术得益于其良好的体验与交互技术,其被广泛用于娱乐、教育以及工业等领域。但目前增强现实技术中所涉及的识别与检测算法通常都是基于图像纹理特征的检测算法,该类算法通常需要待检测物体具有较高的对比度和复杂的纹理图案,而对于特征较少纹理单一的工业零件对象来说,其通常识别效果并不理想,因此研究一种适用于增强现实应用的零件检测算法显得较为必要。在目标检测领域中,Faster R-CNN、SSD、YOLO等优秀的检测网络被广泛用于各领域中,但这类网络通常伴随着巨大的参数量,导致模型体积过大,同时在推理时对硬件的性能要求较高,不便于在资源受限的增强现实设备上进行部署。其次,由于目标检测网络的训练通常需要大量的数据集样本进行训练,在实际的工业生产过程中数据集的标注通常会带来较大的时间成本,因此数据标注问题成了亟待解决的问题。本文针对以上问题,做了如下几方面工作:(1)在轻量化网络模型构建方面,本文通过对YOLOv3中的骨干网络结构优化,来进行网络模型压缩,同时对原始的YOLOv3中的特征融合结构进行改进,以提高网络的检测精度。(2)在数据集制作方面,本文通过采用三维虚拟数据的方式来进行零件数据样本构建,很大程度降低了标注时间成本,同时可通过脚本控制检测零件的大小、位姿和光照条件等,具有较好的数据增强效果。本文优化后的YOLOv3目标检测网络,相比于原始的目标检测网络,在模型精度下降较少的同时,模型的参数量得到了很大程度压缩。本文所优化的网络模型大小只有4.3M,在检测精度方面,优化后的网络在本文的零件数据集上达到了97.57%的m AP。通过在移动设备上测试,本文所设计的零件检测网络对于单张图片检测速度达到了124ms。综上所述,本文中优化后的YOLOv3网络在模型大小和推理精度上满足实际功能需求,并且有利于在资源受限的设备上进行模型的部署,具有一定的实用性。
其他文献
随着目标检测和无人机领域的结合越来越密切,涌现出大量优秀的目标检测算法。无人机航拍图像数据集独有的特点,使得高精度和高速度均衡的目标检测算法成为研究的热点,本文对基于无人机航拍图像的目标检测算法进行探讨和改进,在基于YOLOV4网络基础上的相关改进和实验结果如下:1.针对图像边缘检测和图像填充问题,在输入端,本文设计了自适应图像输入和自适应图像缩放。图像输入使用Mosaic数据增强的方式,将四张输
随着社会的高速发展与进步,电路与系统的可靠性与容错性越来越受到开发人员的关注,在系统的容错性评价中,故障注入技术因其便捷、快速、有效而被越加广泛地被运用。传统的基于边界扫描测试理论的故障注入方法往往需要结合边界扫描硬件控制器来收发指令或数据,通过修改总线、寄存器和内存的数据达到故障注入的目的,而因为需要硬件配合,导致方法较复杂,硬件成本高昂,涉及到软硬件指令,时序繁复。针对上述存在的问题,本文在某
随着医学影像技术的发展,基于不同成像机制的生物组织成像技术被广泛地应用于各种疾病的检测,以辅助医师进行疾病诊断和治疗。无损检测手段的微波热声成像(Thermoacoustic Tomography,TAT)方法融合了超声成像的高分辨率特性以及微波成像的高对比度特性,逐渐演变成为了新兴的并且具有巨大的发展潜力的医学成像方法。基于有限元方法(Finite Element Method,FEM)的微波热
为了满足日益增长的综合测试需求,功率波形分析仪应运而生,该仪器整合了示波器和功率分析仪的功能,应用场景十分广泛,研究一款这样的综合测试仪器对于电子信息产业未来发展意义重大。本文以功率波形分析仪为研究背景,该仪器整体基于采集板卡+FPGA+工控机的硬件方案,拥有4个功率单元,同时支持示波模式和功率模式。人机交互和数据处理是决定功率波形分析仪使用体验和性能的关键,因此本文重点研究这两部分的软件设计及实
新世纪以来,人工智能技术发展迅速,不断改变着社会生产和人民生活的方式,其中典型的便是车牌识别技术。车牌识别技术首先采集车牌图像,通过专门的图像处理系统处理后抽取目标特征,获得识别结果,该技术目前广泛应用在交通管理、警务管理、智能小区管理、自动化收费等领域。与此同时,车牌识别技术面临新的挑战。近年来新能源汽车逐渐普及,但新能源汽车车牌在车牌大小、车牌底色和字符数量上都与传统车牌有着显著的不同,车牌识
无损检测技术涵盖了物理学、材料学、电子科学、控制科学、信息科学、计算机科学以及工程学等多个学科,涉及多种物理现象和相关规律,如电、磁、热、超声、力、光等,具有多学科交叉、实际应用性强、理论与实际密切结合等特点。作为现代工业中生产制造与工件正常运行的重要安全保障之一,无损检测技术在多个工业领域得到了广泛的应用。在无损检测领域,自然微裂纹给材料的表面和亚表面完整度评估带来了检测挑战。电磁热成像检测技术
随着“中国制造2025”的提出,我国制造业要不断向更高水平的自动化迈进,军事、航空航天等对仪器加工精密度有较高要求的领域也要有所转变和提升,产品的质量越发受到关注。现在工业界倾向于使用2D视觉方式进行测量,但是2D无法获取物体的三维数据,而三维测量比二维具有更多信息,可以更加全面、真实地反映客观物体的特征。三维测量作为一种较为普遍的检测手段,在工业制造领域应用广泛。本研究利用线激光轮廓仪作为数据采
天基红外预警系统对于导弹的监测、跟踪和预警,在军事国防方面具有十分重大的意义。预警系统红外成像过程中存在的自然场景虚警源会对导弹目标造成严重的干扰。检测虚警源并消除其对导弹监测的干扰,以此降低预警系统的虚警率,能够有效提高预警系统的准确度和反应速度。本文针对红外成像中不同尺寸的虚警源,基于视觉显著目标检测理论,通过频域分析和空域分析,分别设计了两种检测方法。主要工作如下:(1)分析了预警系统的红外
随着深度学习技术的蓬勃发展,人脸识别技术已经走向了成熟,在日常生活中拥有非常多的使用场景。然而,现有的人脸识别模型主要对高分辨率的人脸进行训练与识别,当图像受到硬件设备、传输介质、运动模糊等条件的影响时,会导致人脸图像处于低分辨率的退化情况,识别成绩将大打折扣。本文使用人脸超分辨率算法解决上述问题,算法的核心是将退化的低分辨率人脸重构为高分辨率人脸,提高其识别率。近年来,基于深度学习的人脸超分辨率
由于太赫兹无源探测技术利用材料特性不同造成的太赫兹频段辐射亮温差异进行成像,探测系统自身不主动辐射电磁波,其具有无辐射、可透视成像、非接触探检等优点。该技术能够提供高分辨率的成像以实现对隐蔽小目标的检测,所以在安检及监控领域有重要的应用价值。目标的检测识别技术作为其中的关键技术之一,对太赫兹无源探测系统综合性能的好坏具有重要作用。本论文依托实际科研项目,针对太赫兹图像隐蔽目标检测识别算法开展了研究