高级语义修复策略的跨模态融合RGB-D显著性检测

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:houlitao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对显著区域定位不完整以及边缘模糊问题,本文提出一种RGB-D显著性目标检测方法。该方法首先设计了一个跨模态特征融合模块来逐层融合RGB和Depth信息,并得到六个模态融合特征输出。该模块降低了RGB和Depth信息之间存在的差异性,为后续的高级语义修复提供更具共性和互补性的深层特征;基于上述模块获得的多层次信息,本文利用后三层特征,联合提取更丰富的高级语义信息,并得到初始显著图。之后,采用U-Net的网络结构,从网络的顶层向下融合,每一层经过上采样之后与下一层进行通道维度上的融合,前三层底层特征在
其他文献
针对地面场景下的红外目标检测易受复杂背景干扰,检测精度不高,易发生误检和漏检的问题,本文以车辆红外特征为研究对象,提出了基于全局感知机制的红外目标检测方法。在以Darknet-53为主干网络的基础上,结合具有全局信息融合的空间金字塔池化机制,在增大模型感受域的同时增强了模型的全局信息感知力和抗干扰能力;设计了平滑焦点损失函数,解决了图像内因目标相互影响而导致的检测精度不高、易出现误检、漏检等问题。
期刊
图像文本跨模态匹配是计算机视觉与自然语言处理交叉领域的一项重要任务,然而传统的图像文本跨模态匹配方法要么只考虑到全局图像与全局文本匹配,要么只考虑到局部图像与局部文本匹配,无法全面有效的考虑局部和全局信息,导致提取出来的特征信息不完善。或者只是简单的对全局图像与全局文本特征进行提取,局部细节信息无法凸显,导致全局特征无法充分表达其全局语义信息。针对该问题,本文提出一种基于堆叠交叉注意力的图像文本跨
期刊
传统的基于深度卷积神经网络(CNN)的滚动轴承故障诊断方法,存在梯度扩散、参数爆炸、小样本泛化能力弱和训练时间长等缺点,主成分分析网络(PCAnet)相比CNN网络结构大大简化,无需反向传播,一定程度上解决了上述问题。而PCAnet本质上还是将图像转化为向量进行特征提取,忽略了多维图像的空间结构关系和内在信息,MPCAnet能从多维空间中提取图像的高级语义特征,提升了处理张量对象时的分类精度。由于
期刊
实际应用中的卫星调度方案往往受到外界因素的影响,例如电磁干扰、卫星失效、云层遮挡以及新任务的动态到达等.需要在短时间内对原始调度方案进行调整并生成新的调度方案,以保证卫星系统的稳定性,因此研究卫星应急调度方法具有现实意义和研究价值.本研究考虑了新任务到达情况下的卫星应急调度,建立了多星协同应急调度的整数规划模型,并提出了一种基于动态邻域结构的卫星应急调度算法(Satellite Emergency
期刊
神经心理测试可以对各认知域受损严重程度做出客观评价,是检测疾病进展、评估药物疗效的有效手段。其中理解力测试部分通过判断受试者是否根据指令要求做出相应动作实现,是老年人认知功能障碍评估的重要部分,有利于痴呆的早预防早干预。提出了一套神经心理测试中理解力检测的人体姿态估计视频分析方法,基于Openpose深度卷积网络提取人体关键点坐标,然后基于图像形态学处理技术和Faster R-CNN等技术提出了纸
期刊
随着三维测量技术的成熟,非接触式3D掌纹采集系统为掌纹识别的研究提供了新的途径。为了提高3D掌纹信息的采集精度,本文提出一种融合双目立体视觉与结构光的便携式非接触3D掌纹采集系统。首先将编码图案投影到目标手掌表面,使用双目相机获取左右视图后,采用格雷码结合相移的方法获取目标的绝对相位信息,然后引入基于波义尔摩尔投票算法进行最大概率校正来降低视差图中的跳变噪声,经过亚像素级立体匹配和双目相机的立体标
期刊
地面背景下的红外目标检测是伪装防护、精确制导等领域的关键技术,针对现有基于深度学习的目标检测模型对地面背景下红外目标进行检测时容易受到复杂背景干扰,对目标关注不足,从而导致检测准确率不高的问题,本文提出了一种基于并行注意力机制的地面红外目标检测方法。首先,利用卷积和注意力并行的下采样方式,在降低模型的空间复杂度和提升训练速度的同时,对目标特征进行聚焦和关注;其次,对主干网络提取的多尺度特征进行融合
期刊
为了提高图像特征点匹配的速度和准确性,提出基于RANSAC算法的极线约束特征匹配算法。首先,将特征点进行规范化处理,并拟选取八个特征点对,利用RANSAC方法计算出包含内点最多的基础矩阵,并优化基础矩阵;接着,求取极线方程,通过最小对极距离准则来寻找准确的匹配点,若匹配点和待匹配点到对应的极线距离小于阈值,且两距离之最小,该点保留,否则删除。最后,从匹配率、误匹配率两方面来分析提出的算法性能,并从
期刊
针对机载成像高光谱遥感仪器获得的大批量高光谱数据很难实现高效快速的矿物信息提取和识别的问题,本文提出了一种基于改进样本驱动的高光谱矿物识别模型压缩方法,对神经网络中的冗余神经元进行剪枝,从而获取高效的矿物识别模型。首先,以验证数据集中的正确识别样本为数据驱动,计算各神经元经激活函数后的输出零值频率,并将其作为该神经元重要性判据,探讨各神经元对神经网络正确识别样本的贡献;其次,通过设置重要性阈值对冗
期刊
输电线路的异常目标检测对提高输电系统的安全性、可靠性、稳定性起到十分重要的作用,而已有目标检测并未针对线路异常目标的尺度变化大、小目标多、光线暗、部分遮挡等问题进行有效设计,导致识别速度慢、易受环境干扰、误报漏报频发等。针对上述问题,本文采用两阶段深度网络,利用FPN提取多尺度特征,使主干网更好的适应目标多尺度变化,并通过全局网络进行特征增强,获得更清晰、更具有代表性的多尺度目标特征。在RPN中提
期刊