基于深度学习的多尺度目标检测研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:ebear2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域非常活跃的研究方向之一,它主要是找出输入图像中所有感兴趣的目标,并确定目标物体的类别和位置信息。近几年,深度学习在图像目标检测中被广泛应用,因其较传统算法速度更快、检测精度更高的优势,成为目标检测领域的主流算法。本文通过对有关的深度学习目标检测算法进行对比分析,综合考虑算法的检测精度和实时性两个因素,选取一阶段目标检测算法Single Shot Multi Box Detector(SSD)作为基础的研究框架,探讨了SSD算法的设计理念、基础构建网络、整体框架模型的构建以及采用的训练策略等,为解决SSD算法中的局限性,主要完成的工作内容如下:(1)针对背景复杂度高、小目标居多等情况下检测精度不高的问题,本文提出了一种多尺度特征增强的目标检测框架(Multiscale Feature Enhanced Network,MFEN)。MFEN-SSD算法设计了特征融合模块,使上下文的信息进行有效的融合。同时在融合后的特征层后面添加注意力机制对特征进行进一步的优化。此外,为了克服非极大值抑制算法(Non-Maximum Suppression,NMS)在密集图像应用场景中的不利,本文采用Distance-Io U(DIo U)NMS来减少漏检的发生。(2)针对传统SSD算法网络模型导致的特征提取不充分,本文提出基于深度残差网络的SSD检测算法。该算法将传统SSD算法的基础网络替换为更深的卷积神经网络Res Net50,更为有效地学习目标的特征信息,并在此基础上构建特征金字塔模型来改善对小目标的检测。在损失函数的设计阶段将GIo U loss作为边界框损失函数。(3)在遥感数据集NWPU VHR-10和地铁安检数据集上对MFEN-SSD算法进行了一系列实验来证明改进模型的有效性。在NWPU VHR-10上的m AP较传统的SSD算法提高了6.7%,地铁安检数据集上的检测精度达到了77.4%,可以检测到许多SSD算法可能会漏检的小目标。在Pascal VOC数据集上对基于深度残差网络的SSD算法进行实验,平均准确率在Io U分别为0.5、0.6和0.75时达到了79.0%、73.4%和55.8%。
其他文献
近年来,时间戳技术的兴起和应用对知识产权诉讼的电子存证领域产生了不容忽略的影响。但由于目前我国有关时间戳认证的制度建设尚处于初步探索阶段,缺乏具体可操作的规范指引,所以时间戳认证在实务中总体呈现出“法院认可较多,否定较少”、“法院对时间戳证据的阐述和论证不足”以及“被告对时间戳证据往往难以进行有力反驳”的特点。对时间戳认证的探讨需要从技术和法理两个层面进行交叉研究。在技术层面,密码学原理和可信时间
学位
目的 探讨心血管磁共振(CMR)T1-mapping技术评价扩张型心肌病(DCM)心肌纤维化的价值,分析T1-mapping量化指标与射血分数(EF)的相关性。方法 选择2015年至2017年在郑州大学第一附属医院治疗的48例DCM患者(DCM组),其中男性38例,女性10例;年龄24~73岁,平均年龄47.40岁;身高155~178 cm,平均身高169 cm;体质量49~98 kg,平均体质量
期刊
采用“引张线+倒垂线”法进行三河闸水平位移监测,每块底板设置2个测点,共设置42套引张线仪,安装在启闭机房墙面。配套自动化监测系统,具有数据采集、管理、通讯、浏览等功能,亦具备人工比测条件,自动监测和人工比测精度相当,均达到有关标准要求。系统应用以来稳定可靠,为工程安全监测提供了技术支撑。
期刊
在模具设计中抽芯力、斜拉杆直径等数值经常需要进行计算,初学者往往不知道如何计算,更多的设计师知其然而不知其所以然,并不知晓公式如何推导,本文详述相关计算推导过程。
会议
推荐系统作为一种信息过滤技术,能够帮助人类在海量的信息中快速获取有价值的内容。传统的推荐算法仅利用评分数据进行推荐,存在着用户与项目交互过少而产生的数据稀疏性问题和新用户、新项目带来的冷启动问题。近年来,随着在线社交媒体的兴起,将社交信息融入到推荐系统成为解决上述问题的有效方法。现有的社会化推荐算法在一定程度上缓解了数据稀疏性问题和冷启动问题,但仍然存在两点不足,首先只考虑评分数据稀疏问题,忽略了
学位
权利人通常为促成契约的达成而自愿或被迫排除某项权利的适用,合同成立后又转向法院请求确认该排除行为无效。我国民法中明确规定特定权利不可排除的条文屈指可数,多数情况下的权利排除条款效力缺乏上位法依据。法律权利纷繁复杂,立法不可能对每一权利能否排除适用进行逐一释明,权利人在民商事活动中或可通过意志性活动排除任一权利,这一行为必然引发关于排除条款效力的争议。本文以委托合同中的排除条款为例进行实证研究,深入
学位
在油气勘探领域中,地震数据重建技术主要用来解决地震数据采集过程中空间采样不足的问题。近年来,基于自学习机制的方法,如机器学习和深度学习,引起越来越多学者的关注。支持向量回归作为一种机器学习方法,也是一种核回归方法,能够实现良好的地震数据重建性能。本文主要是利用支持向量回归方法研究地震数据重建技术。在支持向量回归中,核函数与输入的特征向量直接影响重建性能,因此,本课题研究利用更适合地震数据的核函数以
学位
压铸铝合金曲轴箱是一种成熟、高效的制造生产工艺。某型号曲轴箱因其结构特点,在生产过程中存在一定比例的指定部位裂纹不良。本文就该曲轴箱压铸生产裂纹不良问题,详细阐述了现象调查、原因分析、不良再现,并针对性提出了该裂纹不良改善对策方案,消除生产中不良报废损失,彻底提升该型号曲轴箱品质水平。
会议
模糊限制语是一种广为学界认可的话语策略,且不少学者从语义学和语用学的视角下对其进行了广泛研究,但鲜有学者对调解类电视节目中的模糊限制语进行探讨。本文从调解类电视节目(即金牌调解)中随机选择了18个案例,在耶夫·维索尔伦(1999)提出的语言顺应理论框架下,分析调解场景中调解员所使用的模糊限制语的类型、语用功能、及其语用影响因素。结果表明,调解话语中使用了四种模糊限制语,包括程度变动语、范围变动语、
学位
图是一种当今受到广泛关注的数据重要呈现形式,为了处理高维稀疏的图数据,网络表示学习将其映射到低维空间中,在保留原网络有效信息的同时降低了网络信息的存储成本,便于完成后续的分析任务。图卷积神经网络不仅保留了卷积神经网络强大的表征提取能力,还能够有效的处理不规则图数据,是近期的研究热点。基于拓扑优化的图卷积网络是一类旨在通过优化网络拓扑结构来逼近节点真实联系状态的图卷积神经网络模型。当前对基于拓扑优化
学位