基于多光谱信息融合的行人检测研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:lowner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于多光谱信息融合的行人检测是无人驾驶、智能视频监控等全天候应用中的核心技术,其具体指针对同一场景,同时采用红外和可见光两种视觉传感器获取多光谱(红外和可见光)图像作为输入源,并利用两者的互补性,区分行人目标和背景,完成场景中行人目标的定位,弥补只使用可见光作为输入源的传统行人检测难以应对光照变化、恶劣天气的缺陷。由于多光谱行人检测性能的优劣极大程度上依赖红外与可见光融合机制的优劣,且红外与可见光属于两种模态,两者融合时,各模态对行人检测网络的贡献比重也不能单纯依据白天和夜晚划分,所以多光谱行人检测不仅具有实际应用价值,还面临着诸多挑战,成为学术界研究的热点和难点。论文主要针对选取合适的融合时机和融合方式等方面,设计一种基于红外和可见光两种模态的融合机制,以融合红外和可见光模态,为行人检测提供互补的信息,从而提升行人检测的性能。主要研究内容及成果如下:(1)多阶段特征融合信息复用机制下的多光谱行人检测网络。针对现有一些多光谱行人检测算法只选用某单一特征层做红外和可见光的特征融合,导致特征信息浪费,从而造成行人漏检和误检的问题,提出了基于多阶段特征融合的多光谱行人检测网络。首先,成对的红外和可见光图像经由双流VGG16网络分别提取中间层特征做早期特征堆叠融合,获得早期融合特征,并基于融合特征生成行人建议。区别于单阶段融合直接使用早期融合特征完成后续检测任务,多阶段特征融合策略将生成的每一个行人建议先映射回三个多模态特征进行多特征池化,再进行高层池化特征加权融合,同时使用高低层特征池化策略组合池化特征,以完成高低层特征的联合。最后将池化特征送入全连接层完成检测任务。实验结果表明:在Kaist多光谱行人检测数据集上,获得76.24%的行人检测精度,行人平均漏检率下降至27.63%。(2)模态自适应权值学习机制下的多光谱行人检测网络。针对目前基于红外与可见光模态融合的行人检测算法难以自适应外界环境变化的问题,提出基于红外和可见光信息融合权值学习的行人检测网络。首先,区别于目前大多数研究采用的两模态直接堆叠融合策略,权值学习融合网络考虑两种模态在不同环境条件下对行人检测任务的不同贡献比重,通过双流网络学习二者差异;再根据各模态特征的当前特性自主获得各模态特征的相应权重,进行加权融合得到融合特征。最后基于融合特征生成新的特征金字塔,并改变先验框的尺寸和密集度以丰富行人先验信息,完成行人检测任务。实验结果表明:在Kaist多光谱行人检测数据集上,获得76.55%的行人检测精度,行人平均漏检率下降至26.96%。(3)多模态交叉指导学习机制下的多光谱行人检测网络。针对目前基于红外与可见光模态的特征生成模块大多相互独立,缺乏模态间长期依赖关系,导致不同模态特征差异较大,影响融合效果,造成目标误检和漏检的问题,提出基于双流多模态交叉指导学习的行人检测网络。首先,成对多模态图片送入特征生成模块生成高低层特征,从中间层特征开始,成对多模态特征送入权重感知模块。区别于一般融合机制只用来生成融合特征,权重感知模块还输出各模态的加权特征,并将其分别返回另一模态的特征生成模块,从而将加权信息以联合交叉指导的方式逐步传输到下一层,建立模态间的长期依赖关系;然后融合特征输入下一阶段的权重感知模块,以加强不同阶段融合特征之间的联系,获得更具判别力的特征。最后提取不同尺度的特征层送入检测层,生成行人目标的位置和得分。实验结果表明:在Kaist多光谱行人检测数据集上,获得77.16%的行人检测精度,行人平均漏检率下降至25.03%。
其他文献
信息物理系统(Cyber Physical Systems,CPSs)是将传感、通信、计算和控制过程高效结合而形成的复杂系统。目前,信息物理系统已在智能电网、医疗监测、智慧工厂、智能交通等众多领域得到广泛应用。不同于以往封闭式的工业内部网络,通讯网络的接入极大地提高了系统运行效率同时,也带来了许多安全问题。近年来针对信息物理系统的攻击事件频频发生,造成巨大的经济和社会损失,这已经引起了国内外相关学
图像相较于文字而言,传递信息的方式更为简单直接,因此运用更为广泛,但图像在采集、传输和使用过程中,往往会引起不同程度的失真,这就需要质量评价算法对其进行评估。现阶段图像质量评价的主流算法大多基于机器学习(特别是深度学习),现有研究表明机器学习算法对数据的对抗性扰动极其不稳定,存在鲁棒性和安全性问题。基于此本文研究了一系列的对抗性扰动样本来攻击现有图像质量评价算法,找出其漏洞,希望本文的攻击方式能让
随着物联网应用与规模的持续增长,同时带来了空前的网络安全威胁和安全风险。对此学术界提出利用威胁情报来对日趋复杂的安全问题进行预警和预测,威胁情报作为一种网络安全大数据,可以有效帮助防御者更好地提升网络安全防护能力[1]。在此,如何高效构建威胁情报就成了一个核心问题。然而,当前在信息安全领域,威胁情报普遍存在着冗余度较高、内容单一、标准不统一的缺陷,难以共享。对此本文通过对恶意代码和非结构化网络威胁
随着网络通信技术和集成电路制造工艺水平的不断提高,系统间的信息交换变大。传统的并行传输接口技术传输数据时,具有抗干扰能力弱、时钟偏斜大和传输距离短等缺点,导致传输接口成为限制数据传输速率的瓶颈。为了满足日益增长带宽的需求,高速串行接口SerDes逐渐取代传统的并行接口,成为了高速接口的主流技术。SerDes通常采用差分的传输方式,差分传输方式具有抗干扰能力强和传输距离远的优点。SerDes作为主流
目标跟踪一直是计算机视觉研究领域的一个重要分支,其通过对视频帧中感兴趣的部分进行数字化处理与定位,从而实现有效跟踪。近几十年来,由于研究人员的不断努力,涌现出许多优异的跟踪算法。与此同时,该项技术也在多个生活场景中得到广泛的应用,比如收集交通数据进行交通指挥监视、自动驾驶中用于估算障碍物运动轨迹的视觉导航、医学诊断中超声波图像的自动跟踪分析等等。随着研究与应用的深入,现实场景中诸如光照、遮挡、平面
演化进化算法作为经典的启发式搜索算法,有着优异的性能表现,是解决各类实际问题的重要工具。随着演化进化算法在科学与工业领域的研究与应用越来越广泛,对于其求解效率的要求也在不断地提高。演化进化算法在求解大规模优化问题时的性能表现难以满足高效率的需求。通过在高性能集群上进行并行化研究来解决这个问题具有重要的现实意义。神威·太湖之光拥有超过125PFlops的峰值运算性能,可以为提升演化进化算法求解大规模
随着万物互联的智能时代到来,精简指令集(Reduced Instruction Set Computing,RISC)的优势愈发突显,而作为开源的精简指令集,RISC-V指令集更适合于当下生态开放的环境。为提高指令级并行度,现通用高性能处理器都采用了乱序超标量架构,由于指令乱序调度、分支预测等设计的复杂性,乱序超标量架构一直是处理器领域的研究热点。本文进行了基于RISC-V指令集的乱序超标量处理器
在数据挖掘领域中,聚类分析作为一种数据分析技术,已经发展较为成熟,在机器学习、模式识别等许多领域有着广泛的研究。在大量成熟的聚类算法中,谱聚类因其广泛应用性与扩展性,逐渐受到研究关注。但是现存的大多数谱聚类算法在处理海量数据时计算复杂度和空间开销比较大,并随着数据集维度的增加,算法处理能力的下降,一定程度上影响了聚类结果。为满足当前高维海量数据的分析需求,本文着眼于降低时空复杂度以改进算法效率,同
随着物联网的不断创新,物与人的数字化进程正在迅速加快,工业系统的自动化、智能化水平不断提高,数据处理不再需要人为干预,应用系统通过复杂的通信网络控制着物理空间。这些集成了传感、驱动、控制、通信和计算的系统,被广泛应用于工业领域,形成工业信息物理系统(Industrial Cyber-Physical system,ICPS)。在ICPS中,由于网络层和物理层的紧密耦合以及所处工业环境的复杂多变,使
随着互联网技术的飞速发展与应用,一方面各种新型网络技术(诸如卫星互联网、天地一体化信息网络、命名数据网络等)层出不穷,另一方面网络安全事件频发,网络安全形势日趋严峻。面向日益增长的网络新型技术评测与安全防御技术评估的需求,网络靶场主要利用虚拟化技术,对真实网络空间中的各种要素进行模拟和复现,为网络与安全技术的研究提供测试床,因此具有重要研究意义。网络靶场可包括网络仿真、用户行为复制、安全自动化测试