以注意力模型引导的目标检测研究与应用

来源 :淮北师范大学 | 被引量 : 0次 | 上传用户:V13_ywj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测技术可以对图像中的目标进行定位,其在日常生活和工业制造中都存在着巨大的应用价值。与传统的机器学习和图像处理方法相比,基于深度学习的目标检测网络通常具有更加精准的识别率和更快的识别速度。近年来,深度学习领域的卷积神经网络发展迅速并逐步应用于日常生活的检测之中。如今,基于机器视觉、深度学习的检测技术在道路安全、智能监控等多个领域中已得到广泛应用。例如对公路上的行人进行检测,合理规避风险;对摩托车手头盔佩戴进行检测,分析其安全情况等实际案例,都表明该技术在日常生活中有着巨大的应用价值。为了满足人类的各种需要,目标检测算法也在不断改进。本文以SSD(Single Shot Multi Box Detector)网络为基础并在网络中添加注意力模型进行引导,对摩托车手头盔佩戴检测问题展开研究,由浅入深的论述了全卷积网络目标检测框架的实现原理和目前主流的一些注意力模型的实现原理和效果。在构建网络对目标进行检测时,通过将一步检测网络SSD-Net与视觉注意力机制的模块融合,并进行轻量化处理来改进网络的检测性能,提升网络的检测能力,有重要的理论和现实意义。本文主要研究内容具体如下:(1)采用SSD-Net网络实现对摩托车驾驶人的头盔佩戴检测并优化算法。本文以实际采集的道路摩托车行驶图片为训练样本,在SSD-Net框架下添加RFB(Receptive Field Block)模块,采用VGG-16作为基础网络提取网络结构特征来确定网络模型,并使用余弦衰减学习率作为训练策略对算法进一步改进。实验使用Ubuntu16.04操作系统,利用深度学习框架Pytorch搭建网络,并使用MAP值评估优化前后网络的性能。实验结果表明改进后的RFB-Net模型在摩托车驾驶人是否佩戴头盔的检测问题中具有较高较快的精度与速度,对道路安全具有很好的现实意义。(2)在SSD-Net中合理的引入类似视觉的注意力模块来提高网络性能。针对于摩托车手是否佩戴头盔的检测问题,对主流的单阶段检测网络SSD-Net引入注意力机制模块,使网络提取的特征图在通道和空间上进行权重的重新选择,并增加了类似人类视觉偏心率机制的RFB模块来改善特征的分布。通过使用Mosaic方法进行数据增强,并采用余弦衰减学习率来优化网络,从而完成对摩托车手是否佩戴头盔的检测任务。实验结果表明改进后的网络对摩托车头盔佩戴的检测结果比原始SSD-Net提升了4%-5%的MAP值,具有更好的应用效果。(3)对搭建的通过注意力引导的全卷积网络进行轻量化研究,选择优秀的轻量化主干网络Mobile-Net对检测网络进行轻量化改进,并对摩托车手头盔佩戴进行规范化检测。通过使用Mobile-Net对SSD-Net的主干网络VGG-Net进行替换,实现了Mobile-attention-SSD-Net。该网络通过主干网络轻量化以及注意力模块的添加,使其在保证准确率的前提下减少了网络的参数量、节省了存储空间并加快了网络的检测速度,在应用中体现出明显的优势。
其他文献
随着时代的进步,纺织材料与纺织技术发展迅速,纺织品不仅仅局限于服装和装饰,各种功能性需求也随之而来。非织造布作为纺织产品中的一个大类,市场占比逐年增加,高速发展的非织造产业也凸显出来一些问题,由于产品大多属于易燃物和可燃物,引发火灾或者导致火势蔓延的问题日益受到人们的关注。涉及人民生命财产安全的问题不容忽视,因此世界各国也对纺织产品做出了一系列关于纺织品阻燃要求的相关条例法规。本文对缝编非织造布性
采用SBM-Undesirable模型测算了1999—2017年中部六省的碳排放效率,分别计算了产业结构合理化指数和高级化指数,利用耦合协调模型考察了碳排放效率与产业结构优化的耦合协调度,并对其影响因素进行了实证分析。结果表明:中部六省碳排放效率和产业结构合理化的耦合协调度较低,处在中度失调和中度协调之间,碳排放效率和产业结构高级化的耦合协调度处在中度失调和中度协调之间,但有明显上升的趋势。人力资
本文主要研究偏序集的连通性.有两大方面,一是在有限偏序集上,给出连通的定义及性质.另外是在偏序集上定义连通的概念,并给出连通的一些性质.事实上,后者是前者的推广.首先引入并考察步集,利用步集作为工具建立(有限)偏序集元素间的连通关系.此外,在(有限)不交并偏序集上给出分支、可分分支、不可分分支等概念.指出真通集、非连通偏序集、不交并偏序集三者在结构上的联系.最后讨论有限偏序集与偏序集连通性的相容性
随着计算机算力突破性的提升,卷积神经网络(CNN)已经成熟应用在安全监控、语音语义识别、图片分类、目标识别、智能控制等领域。近年来,神经网络的训练和推理的主要使用平台是GPU,但GPU平台价格昂贵、功耗较高、不适合嵌入式等微型设备,而FPGA平台具有并行高速运算、功耗低、价格一般、适用于微型设备等特点。因此,基于FPGA的卷积神经网络加速平台应运而生。本文首先介绍了CNN卷积神经网的各层结构,包括
毫米级海藻酸钙载水胶囊(CaSA-Caps)具有制备条件温和,包埋率高,生物相容性好的优点,特别适用于对温度和化学品敏感的活性物质的包埋。但由于其pH及温度敏感性,剧烈或长时间的化学作用均会导致它一定程度的降解或塌陷,CaSA-Caps的表面改性方法受到了制约。因此开发反应条件温和、且反应迅速的表面改性方法,实现其保水性能的调控,是目前亟待解决的问题。本研究制备了粒径均一、球形度良好且容载量高的C
随着计算机技术的飞速发展,机器学习在医疗领域的作用得到了人们的广泛关注。一直以来,在乳腺癌治疗和预后过程中,医生的临床经验起着决定性的作用。然而,经验的积累需要大量的临床实践,由于数据量每年以指数形式增长,人工处理数据来发现规律费时费力且满足不了要求,为了提高临床医生诊断的准确率和效率,因此必须通过计算机使用更高效的算法进行处理和挖掘数据。本文数据来自真实世界的1995年至2000年间3088名乳
数学是促进初中生由具体形象思维过渡到经验型抽象思维的重要科目.乡村初级中学的不少学生都存在一定的数学学习困难.初中数学教师可以有效运用信息技术辅助学生更好地学习数学,较好地完成从具体形象思维到经验型抽象思维的过渡.因此,本文对乡村初中数学教师信息技术的应用能力展开研究.本研究采用文献分析法、问卷调查法和数据统计分析法,研究乡村初中数学教师信息技术应用能力的现状及其影响因素,提出乡村初中数学教师信息
随着现代物联网科技的不断发展,市场上越来越多的智能监测系统相继出现,其中火灾监测系统和灭火系统不仅对民众的生活提供了极大的帮助,而且融入到各个场所中保证人民群众的安全,因此火灾监测及灭火系统的一体化设计很有必要。传统的火灾监测系统只是通过简单的报警装置警示群众,发现火灾出现及时报警,这种方式存在控制火势难度大和安全性能指数不高等弊端,不利于火灾的救援。针对传统的火灾监测系统有着诸多问题,本文提出了
浊液是一种常见的分散系,包含悬浊液和乳浊液。浊液成分分析在食品、环境、工业、医药等领域有着重要应用。针对现有化学分析法、光学吸收法等浊液浓度测量方法存在测量时间长、对操作人员的专业性要求高、价格昂贵、不利于移动性快速检测等问题。采用数字摄像头代替传统的光电检测系统,结合图像处理、数据分析技术和神经网络算法,进行图像特征提取和模型建立,实现基于图像的浊液浓度检测方法和装置,并应用于浊度测量和牛奶成分
维生素C又称抗坏血酸,是一种人体必需的维生素,而人体自身不能合成维生素C,主要是通过水果、蔬菜和药物摄入维生素C,过量摄入会造成肾脏损伤。因此,开发简单快捷的维生素C含量测定方法和仪器尤为重要。本文将图像颜色特征提取技术应用于维生素C含量测量,采用数字摄像头代替传统的光电检测单元,结合计算机图像处理和数据分析,研究不同颜色分量与维生素C浓度关系,建立维生素C含量测定模型,实现维生素C含量的测定。主