基于非固定锚框的小目标定位及检测算法改进

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:jyjs1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉任务中的一个重要分支,目标检测的任务是对光学图像或者视频中的物体进行识别和定位,换句话说就是需要标明物体的类别并且要框出物体的位置。因为目标检测要应用于生活场景或者一些比较复杂的场景,所以这时就需要使目标检测算法具有实时性和准确性,就是能快速检测出目标并正确定位和分类。随着人工智能技术的发展,深度学习在目标检测领域用的越来越广泛,人们的生产和生活也到处都有目标检测的应用。例如无人驾驶汽车,人脸识别系统,视频监控录像以及医学图像中病变组织的检测,这些设备中都会用到目标检测,所以目标检测算法的研究越来越受到重视,随着目标检测技术的进步,人们的生活也更加方便快捷。小目标检测的准确性一直是目标检测中的难题。小目标的漏检率和精确定位是限制当前小目标检测系统的两个关键因素。论文提出了一种新颖的二阶段检测方法称为MLR-SODNet(Multipoint Local Regression-Small Object Detection Network),可以同时解决小目标漏检和精确定位问题。对于漏检的目标,论文提出了一种名为SODNet(Small Object Detection Network)的新型主干网络,该主干网络设计了新颖的卷积层,以在传统主干网的较深层中保持较高的空间分辨率和较大的感受野并进行图像分类。为了进行精确定位,论文提出了一个新的边框回归方式,称为MLR(Multiple Local Regression),也称多点局部回归。论文利用这个模块来预测多个边界框偏移量,并将多个偏移量取平均值以得出预测框的最终偏移量。此外,还向整个网络中添加T-Io U(Twice-Intersection over Union)预测分支,在推理阶段,为消除Ro I(Region of Interest)的特征偏移,会预测两次Io U的值,并将最后一次的Io U值与分类置信度相乘作为筛选预测框的指标,从而获得更准确的局部边界框。在MS COCO上进行的实验表明,MLR-SODNet可高效实现最新的检测精度。在MS COCO test-dev上,MLR-SODNet的性能优于现有的二阶段方法。小目标的平均准确率(APS)比原方法增加了1.9%,中目标的平均准确率(APM)增加了3.6%,大目标的平均准确率(APL)增加了5.8%。
其他文献
车联网(Vehicle-to-X,V2X)通信技术,作为我国新基建中物联网技术在高速领域的典型应用,近年来得到了国务院、发改委和工信部等各级政府部门的鼎力支持。为推动V2X通信技术在国内的发展,打造一套成熟的V2X行业商业运营体系,国家政府协调多方部门和单位组建了V2X产业发展专项委员会。现阶段国内正在推进基于蜂窝通信系统的V2X通信技术(Long Term Evolution-Vehicle t
近年来,铁路运输在发展中不断完善,给人们出行和货物运输带来了便利。因此,许多国家都致力于推进铁路基础设施的建设。但由于加纳缺乏投资和铁路相关的维护技术,其铁路行业长期处于停滞状态;直到与中国政府签署了相关融资协议,其铁路状况才有所好转。为了确保铁路运输安全,相关部门必须制定一套科学合理的维修作业计划。但是加纳缺乏维修决策模型。本文根据现有维修作业数据,提出了适用于加纳铁路的轨枕维修线性优化决策模型
论文以国家精密重力测量项目某重点大学山洞实验室隧道工程建设为背景,针对大学校园内新山洞实验室隧道在破碎围岩地质条件、周边复杂建筑结构环境下的施工技术难题,对控制邻近隧道分别在机械施工和钻爆法施工时对周围环境影响的关键技术进行了一系列研究,以指导隧道安全快速完成施工,并将对精密实验室的影响控制在要求范围内。主要的研究内容及成果如下:(1)对国内外邻近精密实验室隧道钻爆法施工影响研究现状进行了调查研究
近年来,赞比亚国家铁路公司面对公路运输的竞争失去了大量客户,陷入经营困境。当前,赞比亚国家铁路公司试图通过改变经营策略,重新夺回一部分失去的市场份额。在这样的背景下,本论文以布拉瓦-哈拉雷通道为例,对影响货主在铁路和公路间进行选择的因素进行研究。本文使用二项Logit模型来分析货主的选择行为。该模型具有较为准确的预测效果,尤其适用只有两种选项的情况(本文研究的通道内只有铁路和公路两种运输方式)。通
工程中混凝土板类构件四边约束、承受集中力的情况比较常见,这类结构受力特点复杂,使用过程中容易开裂,且钢筋混凝土结构的耐久性较差,一旦破坏不易更换维修。近年来由于纤维增强复合材料(Fiber Reinforced Polymer)轻质高强的特点,各类形式的FRP结构应用到了土木工程领域,为解决这些问题提供了新的思路。本文设计了一种新型3D模塑FRP格栅加劲混凝土板,在板开裂时FRP结构能够为板底部提
地铁作为轨道交通的重要组成部分,承载着缓解城市客运压力的重任。近年来我国地铁线路不断扩建,服务能力不断发展,地铁越来越成为人们生活中必不可少的一部分。然而地铁车站中也存在着一些监管缺陷和安全隐患,主要体现在以下四个方面:1、地铁车站内部人员复杂,客流量大,需要对乘客进行实时监控,而目前的监控系统需要工作人员在监控画面中主动寻找目标乘客,并记录乘客行走路线,然后上传到后台信息系统。这样不仅操作复杂,
双渠道供应链的诞生满足了传统企业拓宽销售渠道的需求,能否实现双渠道供应链有效管理是现代企业有无市场竞争力的重要标志,随着互联网电子商务技术的普及和发展,消费者逐渐习惯比价购买,同时,企业品牌推广方式也从原来的单一化变得丰富多样:其中,全国性广告和联合性广告在制造企业中应用颇多。全国性广告指的是制造商承担全部广告成本在全国性媒介上做广告,此广告因影响力较大而会同时增加线上渠道和线下渠道的需求,而联合
程序合成是指根据给定问题的具体描述由计算机自动生成满足要求的程序。这是一种用底层编程语言自动合成程序的任务,其目标是通过具体的算法策略找到符合用户意图的程序。用户意图使用各种形式表示,包括逻辑规范、示例、自然语言、部分程序甚至相关程序。语法引导的程序合成问题使用逻辑规范来表达用户对于期望程序的要求。最新的研究证明,使用语法模板来补充逻辑规范对于求解程序合成问题有潜在益处,即由逻辑规范和语法规范组成
随着社交媒体的高速发展,以微博为代表的新兴媒体成为信息交流的重要平台。在给人们的生活带来便利的同时,开放的微博平台也成为了谣言重要发源地。传统的谣言检测方法大多通过学习转发评论信息的语义表示进行研究分析,此时谣言已经广泛传播,造成了很多严重的后果。谣言早期检测能够更大程度的减少谣言传播范围,具有更重要的现实意义。由于潜伏期的谣言暴露的特征非常有限,使得谣言的早期检测非常困难;同时传统的谣言检测忽略
前置仓将仓库从城市远郊前移,成为最靠近消费者的物流节点,“区域配送中心+前置仓”这一模式逐渐在电商行业内流行。B公司作为生鲜电商行业的头部商家,疫情至今销量迎来新一轮增长。目前B公司现有的“区域配送中心+分拣中心+站点”的物流配送网络在目前竞争环境下已暴露出缺陷,考虑进行业务模式升级。结合当下行业生鲜电商运营模式,通过在北京市的仓库备选点中选定一定数量的前置仓,实现直线距离五公里范围内生鲜订单两小