基于深度学习的安检图像中威胁物品检测研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:winskinglee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在公众运输管理领域,对行李实施X光安检是保障乘客生命财产安全的重要方式,但安检人员以肉眼观察图像来确认威胁物品易受人为因素影响且效率较低。深度学习是提升威胁物品检测精度的有效手段。然而,大多数检测方法仍存在提取特征质量较低,多阶网络层交互能力不足的问题。本文通过强化网络模型特征提取和多层语义信息交互能力来提升威胁物品分类精度和检测效率,主要研究内容如下:1.提出了浅层多头空间注意力机制、深层多头通道注意力机制和跨层高分辨语义模块,改进了卷积主干网络对威胁物品的特征提取及融合能力,提升了威胁物品的分类及定位精度。对浅层网络提出多头空间注意力机制,用不同压缩函数减小空间特征后,生成的空间全局关联特征与浅层特征进行级联交互;对深层网络提出多头通道注意力机制,用不同全局池化方式获取通道特征后,前馈神经网络输出的通道全局关联特征将与深层特征逐元素交互;对多阶网络层提出高分辨语义模块,将多层特征按相同空间维度级联后,通过预设卷积集融合。在安检数据集SIXray的分类及定位实验结果表明,结合不同注意力机制和特征融合模块的主干网络能有效提升特征提取及融合能力,对威胁物品实现更精确地识别及定位。2.提出了轻量级的注意力Transformers Only Look Once(TOLO)检测分支网络,改进了网络对威胁物品的特征提取及融合能力,有效提升了威胁物品的检测效率。所提网络包括颈部和头部两个部分,采用深度可分离卷积设计,降低了模型参数,加快了模型推理速度。提出的颈部网络由特征融合网络组成,将主干网络不同层特征以相同路径实现融合,为头部网络提供高分辨语义特征;提出的头部网络由轻量级视觉Transformer组成,根据融合特征建立局部特征间全局关联性,使检测分支网络更关注威胁物品区域。在SIXray数据集中对手枪、刀具、钳子、扳手和剪刀等5种不同威胁物品进行检测的结果表明,该网络的平均精度均值可达84.4%,每秒可传输62.1帧。结合提出的基于卷积神经主干网络的多注意力机制,能进一步将检测精度提升到86.2%。
其他文献
微波光子滤波器(Microwave Photonic Filter,MPF)作为微波光子系统的重要组成部分,承担了使用光学元件在光域中实现微波信号滤波的功能。对于集成MPF而言,实现更灵活的滤波频谱、更高的滤波性能以及提高器件集成度是所追求的主要目标。因此本文围绕硅基集成光子器件及其构建的MPF,实现了更大且更灵活的滤波工作频段,减小了器件尺寸。同时针对不同应用场景优化了滤波性能以有效提升频谱使用
学位
在教育信息化背景下,传统的高职英语评价模式存在诸多弊端,无法服务现代高职教学工作。该研究基于移动教学平台,将信息技术融入教学中,搭建高职英语混合式教学模式。该模式通过线上、线下两种平台,课前、课中、课后三个阶段展开教学。与此同时,构建和实践线上线下相结合、知识和情感兼顾、教师和学生同参与的混合式评价体系。
期刊
本文研究了矿产资源在水产养殖业中的应用,表明作为水产饲料和改善水产养殖环境的天然矿物和岩石有20多种。如沸石、麦饭石、膨润土、硅藻土、凹凸棒石、海泡石、稀土等。它们具有饲料添加剂、净化剂、调节剂、催化剂及除虫灭菌和治疗等功能。文中阐述了它们在水产养殖中的作用机理,其对鱼类的生殖、生长、发育、防病等均起着重要作用。我国海水、淡水养殖面积广阔,矿产资源丰富,开发水产用矿产资源前景良好。
期刊
英语教育作为职业教育国际化水平提升的助推器,承接为国家培养国际化技术技能人才的重要使命。研制高效、可信、公平的评价机制是提高英语教育质量的重要途径之一。当前高职院校英语评价仍沿袭本科院校的评价机制,缺乏高等职业教育特色,培养的人才难以满足国际化的需求。本文基于OBE理念,构建出适合高职特色的英语“三化”(项目化-作品化-职业化)评价机制,以推动高职英语评价体系的创新。
期刊
高光谱图像(Hyperspectral Image,HSI)包含数百个窄而连续的波段,在地物探测、目标检测和农业生产中得到广泛应用。近些年,基于注意力机制的深度学习方法在HSI分类中展现出良好的性能,但在池化策略和捕获方向依赖性方面仍存在一些问题,本文为此开展了如下研究工作:1.针对传统通道注意力机制在池化时均等对待所有像素的问题,提出了一种端到端的基于概率邻域池化的注意力网络(Probabili
学位
索引调制(Index Modulation,IM)技术利用通信系统中某些资源的激活状态传送附加信息位,希望在不增加硬件成本的情况下提高系统频谱效率。可重构智能表面(Reconfigurable Intelligent Surface,RIS)作为一个由大量低成本无源反射元件组成的超表面,可在不增加发送信号功率的同时对无线传播环境进行智能重塑。将IM技术与RIS技术进行融合,通过控制RIS反射单元或
学位
对话交流是自然人表达情感的主要方式之一,分析文本对话中的情感是实现人机设备智能化、情感化的关键步骤。然而,由于自然对话内容的多样性、人类情感的多变性,现有文本对话情感分析方法存在深层语义信息利用不足、不同类型特征交互不充分等问题。为此,从语境上下文和社交背景信息出发,通过层次特征的高效提取与交互融合进行研究。1.针对对话语境中提取上下文特征与细粒度特征时存在的矛盾,不同层次信息交互不足的问题,提出
学位
视觉同时定位与地图构建(Visual Simultaneous Localization and Mapping,VSLAM)利用相机在无先验信息的环境中同时定位机器人和构建环境地图,以保障移动机器人能够实现完全自主运动。大多数视觉SLAM系统仅使用点特征来获取视觉信息,但前提是必须有理想的光照和纹理条件,这样才能获取足够的环境信息。所以,光照变化明显和弱纹理等复杂环境下的基于特征点法的视觉SLA
学位
行为识别是视频理解领域的重要基础任务,因其极高的应用价值吸引了越来越多的关注。现有主流行为识别方法主要应用于可见光视频领域,而红外视频领域的研究相对较少。然而,在一些特殊场景下,可见光视频会因为自身成像特性难以获得较好的图像质量。例如,在低光照环境中,场景中发生的行为即使是人工辨别也有一定难度。相对于可见光视频,红外成像视频具有对光照环境不敏感、抗干扰能力强等特点,能够在低光照环境中得到较好的成像
学位
为了得到更好的焊接件,解决在电子束焊接中焊件间焊接角度无法调整的问题,设计出可方便调节两个采用直线形运条法焊接的钣金零件的焊接角度的定位装置,重点对夹持部位进行分析,得到合理的设计方案,进而使两个零件的焊接工作更精确。同时,为了得到其所能夹持的零件的最大重量,对夹持部位进行仿真,进行应力应变分析,得出所能夹持最大重量是36.3kg。验证了此汽车钣金焊接定位装置在实际工作中有提升焊接工作效率的意义。
期刊