基于可见光和红外模态融合的目标跟踪方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:h120568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合性工业和国防设备需无人系统在复杂境况下能实现全天候高精确度应用。近年来,视觉目标跟踪技术在机器人研发、自主汽车行业、人机界面设备和视频监控设备等方面获得了广泛的运用。凭据所输入的信息源,跟踪方法大体上分为可见光图像目标跟踪、红外图像目标跟踪和可见光与红外融合目标跟踪。目前应用最普遍的是可见光目标跟踪,但是可见光图像易受到复杂环境的影响,导致跟踪性能的下降。本文针对未知环境下挑战,以提高跟踪稳定性、精度和实时性为主要研究目标,从可见光和红外图像融合、物体跟踪识别等环节开展相应的研究。主要研究内容如下:(1)多模态特征提取方法的研究。RGB和红外数据包含同一场景的不同特征信息,它们的互补优势克服了单个源成像的局限性。如何有效的利用它们的互补优势成为了提高跟踪和检测精度中至关重要的问题,并且两者包涵的信息量不同,因此本文提出了多层次特征提取网络,用于提取不同模态的不同深度的特征信息。(2)针对红外特征与可见光的特点,提出了一种基于注意力机制的多模态特征信息互补机制。由于红外成像设备具有不受光照、烟雾和雾霾干扰等特点,生成的红外图像更加稳定。本文将浅层红外特征作为上下文信息强调对RGB特征的共享部分的关注,利用红外图像稳定的特性,同时利用了RGB图像特征信息更丰富的特点。通过上下文信息强调后的RGB特征与红外特征进行融合,利用了多模态共享特征,也利用了多模态特定特征,达到充分利用多模态互补优势。(3)针对跟踪机制导致的跟踪漂移问题,提出了一种基于可见光视频的重识别模块。受到全卷积孪生网络与相关性滤波算法的启发,本文设计了区域重识别模块。因复杂环境导致跟踪漂移时,该网络能重新预测目标中心,实现提高跟踪精度的目的。
其他文献
脚骨脆(Casearia balansae),为大风子科(Flacourtiaceae)脚骨脆属植物。在民间,本属植物表现出抗疟、抗感染、抗炎等活性,用于治疗肠炎、胃溃疡、病毒感染、炎症等症状。脚骨脆中富含萜类成分,尤其是克罗烷二萜,为了发现更多有活性的克罗烷二萜,我们对脚骨脆的化学成分进行了深入研究。炎症,尤其是慢性炎症,涉及多种疾病的发病机制。过度的炎症介质是炎症反应的表现,对组织或机体有害,
学位
信息网络普遍存在于现实生活中,如:社交网络、经济合作网络、交通运输网络等。各种网络正改变并重塑着人们的日常生活。而影响力最大化问题作为网络分析中一个重要的研究领域,其目的是在信息网络中寻找最具影响力的种子节点集合作为初始的信息传播源,使得这些种子节点组合在一起的信息扩散范围最大。该问题的研究对于控制舆情、制定营销策略、防范疾病爆发等都具有重要的理论意义和实用价值。目前,大部分影响力最大化的研究都面
学位
图像修复起源于欧洲文艺复兴时期,随着科学技术的发展和日益增长的美好生活需要,图像修复逐渐成为人们生活娱乐和文化保护的重要方式。图像修复主要从图像的三个角度着手:结构、纹理和语义。传统的修复方法主要从破损图像的结构和纹理进行修复,会忽略图像本身的语义。现有的基于深度学习的修复方法能够获得较高质量的图像,但从结构的连续性和语义合理性两方面来看,这些方法仍然存在修复图像不能与真实图像达到高度一致的问题。
学位
随着知识图谱(Knowledge Graph,KG)相关技术的快速发展,领域KG已经成为学界和业界关注的重点。与传统的领域数据管理方法相比,领域KG作为结构化的语义知识库,能够帮助人们有效地获取知识之间的逻辑关系,从而为智能问答、搜索引擎和决策支持等领域应用提供数据支撑。因此,高效的领域KG构建,对领域知识的有效管理、直观展示等具有重要意义。由于领域KG的适用范围较小且更加注重知识的准确度和深度,
学位
社会影响是指个体的意见或行为受他人的行为所影响的现象,主要通过人与人之间的交互活动体现出来。社会影响力的研究在经济社会学与市场学范畴中有着较长的发展史,这给影响力最大化(Influence Maximization,IM)在社会网络中的传播研究奠定了一定的基础。在社会网络中,每个人都不是独立存在的,他们之间相互联系,对彼此都有着或多或少的影响作用,而他们之间的影响深浅,范围大小取决于诸多因素。IM
学位
负荷数据自身存在高维的非线性特征,同时负荷数据也会受到气象,电价等外部因素影响,特别是净负荷数据直接与光伏发电出力相关。因此,负荷数据在预测时,其特征的构建和选择直接影响到模型的精度和预测成本。本文通过数据驱动的方式建立负荷预测短期模型,主要取得以下研究成果:(1)针对负荷相关因素的高维非线性特征影响模型预测精度与训练成本问题,文中设计了一种利用相空间重构(Phase Space Reconstr
学位
图像到图像翻译是计算机视觉和图像处理方向热门的研究课题,它的目标是在不同的视觉域间学习一种映射关系,将源域的数据分布变换至目标域的数据分布,同时保留源域的内容特征。图像至图像翻译包括多种有趣的计算机视觉和图像处理应用,包括图像风格化、图像超分辨率、图像语义生成、图像修复、图像编辑等。总之,图像到图像翻译是一个广泛、有趣且有影响力的研究课题,包括计算机视觉、计算机图形学和数字图像处理中的若干重要问题
学位
声纳是人类探索水下世界的眼睛。伴随着人类社会发展,对各种海洋资源的需求不断增大,声纳也随之成为世界各国都日益重视的研究对象[1]。其中,成像声纳系统可以对水下世界进行实况显示,可对水下资源开采、水下救援、水下打捞等提供重要辅助作用,研究意义重大。本实验室此前研究开发的TKIS-Ⅰ机械扫描成像声纳是一款单波束机械扫描声纳,目前已有20多台成品装备于各海军救援部队,该声纳能满足中远距离探测需求,但也存
学位
联邦学习能够使分布式客户端在不共享本地真实数据的情况下联合进行深度学习模型训练,有效解决了数据孤岛的问题。现有的联邦学习方案存在通信成本过高及部署模型参数量过大的问题;同时分布式客户端与中央服务器需采用相同的网络结构,无法保证本地模型的异构性与隐私性,这些情况的出现成为了限制联邦学习发展的主要瓶颈。针对这些问题,本论文基于集成知识蒸馏技术,研究低通信成本和低联邦模型参数规模的联邦学习技术,具体内容
学位
在拍摄图像时,不可避免的会受到相机设备、采集环境以及传输信道等方面的影响,导致获取到的图像中存在明显的噪点,干扰人们对图像信息的理解与分析。为了确保图像内容能够准确的表达,需要在采集和传输后对图像进行去噪处理,减少图像上多余的错误信息。最近的一些研究在消除加性高斯白噪声方面已经获得了较为显著的效果,但仍难以应用在真实场景图像上。因为现实生活中,图像上的噪声分布都是不确定的,使用去除高斯白噪声的算法
学位