改进YOLOX火灾场景检测方法的研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:huaxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有目标检测模型难以应用在复杂火灾场景的问题,论文提出了基于注意力机制改进的YOLOX火灾场景检测模型,实现对火焰、烟雾以及受灾人员的检测.首先,在CSPLayer层上添加轻量级注意力模块,提升模型整体的检测性能;其次,引入通道混合技术,提高各通道间的交流能力;最后,将主干网络最后一层换为轻量级Transformer模块,强化主干网络对全局信息的抓取能力.通过在自制火灾数据集上的实验表明,T-YOLOX的mAP比基准模型(YOLOX)提高了2.24%,与CenterNet、YOLOv3相比检测精度有较大提升,证明了该算法的有效性和优越性.
其他文献
为了对比评价超声B-mode ratio及MR-IP-OP两种检查方法对糖尿病患者颌下腺脂肪沉积的诊断效能.选取志愿者174人(糖尿病患者89人和健康志愿者85人),利用超声B-mode ratio技术和3D MR-IP-OP方法评估和检测颌下腺的脂肪含量.使用独立样本t检验比较两组患者B-radio和MRI-IP-OP的FF值组间差异.采用受试者工作特征曲线(ROC)分析两种技术对颌下腺脂肪沉积的诊断效能.用Spear-man相关系数评价两组参数之间的相关性.糖尿病组的B-mode ra?tio值(1.
针对广义符号网络,论文在复杂网络结构洞、洞主、无特权网络等概念的基础上,提出了节点的邻居集和洞数的概念,并基于这两个概念对无特权网络进行分析.之后,考虑了与无特权网络无洞主相反的情况,即每个节点都是洞主的网络,提出了全洞主网络的概念,并给出了一种生成全洞主网络的方法,对这样的网络进行了分析并将其与无特权网络进行了比较.最后,数值仿真验证了提出的方法的有效性.
针对传统头部姿态估计网络存在空间结构信息易丢失问题,论文提出一种将胶囊网络与传统卷积神经网络相结合的头部姿态估计网络模型.该模型采用具有多级输出结构的传统卷积神经网络,将不同层级的空间结构信息和语义信息进行提取,同时利用胶囊网络能够充分保留特征信息的优点,将提取的特征进行编码,从而使其以胶囊的形式进行传递和输出,有效避免了空间结构信息丢失的问题.实验结果表明,论文提出的模型在AFLW2000和BIWI数据集上的平均绝对误差分别为5.68和4.33,进一步提高了对头部姿态估计的准确度,并在室内条件下对光照变
多标签学习是分类任务中一个重要研究方向,如何保证高分类精度是关键要素.论文提出基于相似度的多标签分类算法SMLC.该算法首先构建实例相似度函数,再采用并行计算方式算出相似值,最后通过加权计算类标签集合权重或者学习阈值方法预测类标签集合.仿真结果表明,与RankSVM、ML-KNN算法对比,SMLC在多标签分类任务的多个指标上表现更优.
针对一类多智能体系统,研究了系统在切换拓扑结构下的一致性控制问题.假定系统拓扑结构的变化符合马尔可夫过程,设计与切换拓扑结构相关的一致性协议,利用线性矩阵不等式和随机稳定性理论,给出了多智能体系统满足一致性的充分条件,并通过数值仿真验证了所提控制方案的可行性和有效性.
城市道路中常设置具有3D效果的平面路障或标志物,其具有高度的立体性和真实性,导致行人和辅助驾驶系统误判而造成严重事故,因此需要对道路立体目标进行识别,以获得真实路面情况.常见的射影不变量如交比是基于共面五点计算的,存在局限性,论文提出一种基于空间点元素的几何不变量计算方法,把空间元素的共点和共线用具有物理意义的量来表示,通过合理搭建把空间元素巧妙转化为共面关系.该几何不变量只依赖点的空间坐标,与投影视角、摄像机参数等无关.在三维造型软件SolidWorks上进行模拟实验,并用该计算方法对真实道路上的真假3
多视角聚类通过利用多视角之间的互补性和一致性信息来提高聚类的性能.近年来受到越来越多的关注.为了及时掌握目前基于图的多视角聚类算法的研究现状与最新技术,对大量的、最新的多视角图聚类进行调查、归纳整理、分类及总结.根据多视角聚类涉及的算法机制和数学原理,并进一步分为基于图、基于网络和基于谱的聚类方法.不仅详细介绍了每一类算法数学原理、算法模型,而且还举例说明了这些算法的应用.报告了基于图的多视角聚类的现状,最后总结了各类算法的优缺点,并指出了当下的挑战以及未来研究发展的方向.
论文对近似二阶EKF(ASEKF)进行了理论分析,了解其滤波原理和特点,并以空中抛射物为滤波仿真研究对象,建立抛射物的运动跟踪系统的离散化状态方程,利用ASEKF估计系统状态量,再由状态量计算系统输出量.仿真结果表明,ASEKF滤波法具有较高的估计精度和收敛性,而且效率较高,抛射物的运动跟踪误差基本在2%以内,远小于构造的观测量误差.
针对红外与可见光图像融合时出现的细节模糊、对比度降低等问题,论文提出了一种基于非下采样轮廓波变换(Nonsubsampled Contourlet Transform,NSCT)和卷积稀疏表示(Convolutional Sparse Representation,CSR)的图像融合方法.首先,分别对红外图像和可见光图像进行NSCT分解,获取其高频子带和低频子带.然后,通过导向滤波增强高频子带,并将增强后的高频子带系数通过选择最大值策略进行融合;同时,利用CSR模型和选择最大值策略得到低频子带的融合稀疏系
针对近似空间笛卡尔积粗糙集模型及其可分解性问题,采用直觉模糊三角模算子构成新的直觉模糊积近似空间,研究了基于直觉模糊知识粒下积粗糙集模型的分解及合成问题.首先,运用直觉模糊三角模运算构造出新的直觉模糊关系,验证了其符合等价关系的条件,并给出新的等价关系的算法原理;其次,构建了直觉模糊积粗糙集模型,对其模型结构及数学特性进行了研究,并给出了积粗糙集的生成算法原理;最后,逆向研究直觉模糊知识粒的分解问题,证明了针对模糊知识粒度分解而提出的猜想.文章旨在对直觉模糊积粗糙集模型的分解与合成机制进行理论探索,为粗糙