基于深度学习的室内多目标检测研究与应用

来源 :浙江工业大学 | 被引量 : 1次 | 上传用户:zkl_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业4.0时代的到来和《中国制造2025》的制定,我国工业逐步向智能制造领域发展,由制造大国向制造强国转型。在传统机械制造业物料需要人工进行搬运,在物料搬运过程中需要用到大量的搬运设备,在使用过程中普遍存在随意放置搬运设备的现象,每次需要花费较多时间对设备进行寻找和清点,不利于提高生产效率。本文提出基于深度学习的室内多目标检测应用于工厂室内目标检测场景中,通过摄像头对目标设备进行识别与定位,便于搬运人员快速找到所需设备,对于提升生产制造效率、降低设备闲置率、提升工厂智能化有着重要的意义。本文针对室内场景目标检测中存在的光照、遮挡、形变等问题,以基于深度学习的室内场景的多目标检测技术为题,重点研究了室内场景的多目标检测网络的优化,并以对设备检测为例,描述深度学习在室内工业场景多目标检测上的应用。论文主要内容如下:1、YOLO v3算法的测试及研究YOLO v3算法是目前应用最广的目标检测算法之一,其在速度与精度上都有着不错的表现。在对YOLO v3算法进行详细介绍之后,本文使用复杂场景训练集对YOLO v3网络模型进行训练,训练后的YOLO v3网络模型通过横向对比测试,将其与同为基于线性回归的目标检测算法SSD和基于候选区域推荐算法的Faster RCNN算法进行对比测试,从测试对比结果中,YOLO v3算法依靠残差深度网络在检测精度上要优于SSD,但由于检测机制的差异,基于候选区域的目标检测通过二阶段网络的特征提取检测性能要优于单阶段的线性回归算法,YOLO v3的检测精度略低于Faster RCNN 2.3%。基于该部分的研究可以得出结论:特征提取网络的差异对于模型精度有明显的影响。2、基于YOLO v3算法的网络优化通过对YOLO v3的分析,得出其对于复杂场景目标检测存在的缺陷有以下几点,一是对于遮挡目标的检测能力较弱,二是模型的泛化能力较差。基于以上两个方面的不足,本文使用了多感受野的特征提取机制,增强了YOLO v3的特征提取能力。通过实验和测试结果证明了更加丰富的特征信息对于提高网络精度和增强泛化能力有明显帮助,检测精度高于优化前的m AP值。经过对模型的对比测试,采用多感受野机制优化的YOLO v3网络相比于优化前平均精度提升了3.3%,针对于一些复杂目标的检测,精度都达到了6%以上的提升,对于预测框与标注框之间的拟合程度也达到了78.7%(average iou),相比于优化前也提高了3.5%。多感受野的特征提取机制对于提升网络检测性能有明显的帮助,系统搭载优化后的网络模型其整体鲁棒性也有显著提升,实用性更强,优化后的网络适合复杂场景目标检测。3、工厂室内场景下目标检测和目标定位实验及分析将优化后的YOLO v3网络模型应用到工厂室内场景目标检测中,构建了常用设备数据集,对优化后的网络结构进行训练和测试,通过对比测试,优化后的网络模型在工业场景检测上有较高的精度。介绍了两种目标定位算法,对两种目标定位算法进行测试,通过对比测试,基于区域估计的目标定位算法平均误差为1.32米,可以满足目标设备位置的计算。4、工厂室内目标检测系统设计与实现采用搭载有目标检测和目标定位算法的PTZ摄像头对工厂室内场景目标进行检测和位置计算,并将检测图像和检测信息传送到客户端。通过对系统功能的分析与研究,设计了工厂室内目标检测系统。客户端具有显示检测画面、搜索工具和查看目标位置的功能,经过测试,系统对目标检测精度较高,可以满足检测要求。经过对工厂室内场景数据集的测试,基于深度学习的室内场景多目标检测方法具有一定的有效性,实现室工厂室内目标检测任务。
其他文献
目的:功能良好的血管通路是保障尿毒症患者长期维持透析的必备条件。动静脉内瘘作为首选的血管通路具有优势。然而,AVF的通畅性又被众多因素影响,导致动静脉内瘘功能障碍。随
可见光通信是一种利用照明光束来传输信息的通信技术,它的带宽范围广泛,传输速率高,符合智能交通中绿色环保、快速出行的概念,满足当代通信需求,成为未来文明城市发展的必备技术。但是,由于室外环境复杂,LED交通灯在传输过程中会受到大气湍流的影响,导致光脉冲能量衰减,通信距离变短。同时,太阳光等其他光源也会在接收端产生辐射噪声,造成系统误码率上升。因此,本文旨在依据脉冲调制技术、大气湍流理论和背景光理论来
进入新世纪以来,国家经济建设步伐逐渐加快,能源消费结构不断优化,油气管道行业发展不断加速。交通情况的改善,通讯技术的更新,设备可靠性的增强以及自动化水平的提高也进一
经济的飞速增长为物流企业带来了很多机遇,规模不断增加,单车场和单车型的配送模式已经无法满足大规模的配送需求,因此,其服务模式也在不断变化。目前,多个车场和多种车型的
下蜀黄土是分布于长江中下游地区的一套中、晚更新世黄土堆积物,为我国最南端的、大范围分布的风尘堆积,是亚热带地区较长时间尺度的陆相地质记录,记录了我国亚热带地区的古环境演化历史,长时间以来受到第四纪学术界的极大重视。物源是黄土研究的基础工作之一,对下蜀黄土物源的研究,不仅能够揭示物源区和物源区的古环境信息,还可能为探究古粉尘的搬运和扩散提供关键证据。下蜀黄土的物源存在较大争议。已有研究中,利用地球化
班杜拉认为人对行为的决策是主动的,人的认知变量如期待、注意和评价在行为决策中起重要作用。教师在教学活动中可以应用自我效能感理论,提高学生学习动机水平,从而提高学生
工期可指派的调度问题和多代理的分批交付问题都是在经典调度问题的基础上发展而来的。在之前的研究中,两种问题都是分开进行研究的。并且在工期可指派的调度问题中,工件的工期通常是事先给定的常量,但在很多情形下,工期是需要决策者根据实际情况来决策的变量。分批调度问题通常只考虑具有一个代理的情形,而忽略了现实中多个代理竞争使用有限资源的情形。本文主要研究具有两个竞争代理和工期可指派的单机串行批交付调度问题。对
在北半球温带森林植物区系中,东亚比同纬度北美、欧洲地区体现出更高的生物多样性,例如,鹅耳枥属共约50种,其中46种分布于东亚地区,但目前对于该属在东亚的多样性演化历史还不清楚。化石是植物在地质时期存在和演化的直接证据,对于认识植物的多样性演化具有不可替代的作用。本文系统的研究了滇东南马关地区下中新统地层中发现的33件鹅耳枥属苞片化石标本,对其属种分类特征进行了详细的比较、讨论,识别出鹅耳枥属6种,
目前高清数字电视已经在我国全面普及,4K超高清数字电视将会成为下一个热点。而从高清到超高清的过渡存在一些问题需要解决。首先现有的视频源大多数分辨率较低;其次,超高清
目的:探讨周围神经显微减压术治疗上肢透析相关周围神经病(DRPN)的疗效。方法回顾性分析2017年1月至2017年12月中日友好医院神经外科收治的15例上肢DRPN患者的临床资料。15例