半全局匹配算法的改进和火场动态图像预处理及特征匹配研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:yuyugugu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目立体视觉技术结合不同视角下的场景信息,通过图像匹配算法实现视差图的计算,进而根据三维几何参数计算场景深度,还原三维空间立体模型。在实际图像采集过程中,由于光照、透射、前景遮挡、低纹理等因素的影响,图像匹配成为立体视觉技术的关键步骤,关系着三维立体模型的精度和效率。同时,伴随自动驾驶等领域的发展,对图像深度信息的获取精度和速度有了越来越高的要求。针对以上问题,本文设计了一种改进的半全局立体匹配算法,兼顾了匹配精度的同时提升匹配效率;另外,本文对火场环境下的立体匹配技术进行应用,在实际工业现场环境中检验匹配算法的准确度和鲁棒性。本文主要创新性如下:(1)对局部匹配算法中LBP算子进行改进。LBP算子对光照环境的鲁棒性好、计算复杂度低,但在弱纹理区域及物体边缘表现较差,这是因为存在较多冗余像素且容易受到噪声影响。本文通过间隔选点的方式对LBP算子进行改进,构建了初始匹配代价空间,筛除冗余信息的同时获得了更大的感知范围。(2)对SGM半全局立体匹配算法中代价聚合路径进行改进。匹配代价聚合是SGM算法的灵魂,传统匹配代价聚合有8路径或16路径且赋予相同权重,部分路径的聚合依赖于前一像素或后一像素的匹配代价,需要大量空间缓存数据。本文对SGM聚合路径进行改进,按照物理存取规则和先验视差约束条件,将聚合路径精简为5条,结合灰度约束和距离约束原则实现权重自适应分配。实验验证,本文改进的稠密匹配算法在Middeval2数据集中,匹配平均准确度95.94%,相比传统SGM算法准确率提升3.5个百分点,计算速度提升50%以上;在Middeval3数据集中,匹配平均准确度86.6%,相比传统SGM算法准确率提升5个百分点,计算速度提升2 3。(3)双目立体视觉技术在工业现场领域的应用。本文通过对视频抽帧、多帧图像差分技术,实现了对火焰的模糊和燃烧物边缘的增强,降低了火焰跳动对立体匹配算法的影响;阐述了几种特征点匹配算法原理,选择将SURF算法应用到特征匹配中,在实际场景中进行匹配算法验证。实验结果指出,将本文预处理技术与SURF算法结合,可以实现平均匹配准确率90%左右,计算速度2.5s,可以满足特征动态匹配的项目需求,实现了较为鲁棒性的匹配效果。
其他文献
基于深度学习的三维目标检测方法需要大规模的标注数据才能达到良好的性能,而三维框的标注需要标注者在不完整的2.5D稀疏点云下,凭经验不断调整其边界,标注难度大且容易引入标注误差。为了解决标注难问题,本文对自监督三维目标检测方法进行深入研究,主要分为以下三个部分:(1)为了解决三维目标检测对大规模标注数据的依赖和标注难问题,本文设计了“预测—渲染—比较”三段式结构的自监督双目三维目标检测网络,只需要简
海洋监测系统主要负责对海洋情况进行视觉监视和参数检测。随着人工智能技术的崛起,将深度学习技术应用于海浪检测上的研究成为了海洋监测系统的发展趋势。目前将深度学习应用在海浪参数检测上的研究大多数只关注到二维卷积神经网络对海浪图像的二维特征提取,网络模型只能学习到海浪图像的空间信息。为了能对海浪运动的时间信息加以利用,本文通过将二维卷积核增加时间维度扩展成三维卷积核,提出一种基于三维卷积核的神经网络模型
视频分割方法对于众多计算机视觉任务非常重要,尤其是在影音娱乐的视频交互应用中。基于深度学习的视频分割方法在测试数据集上显示出比传统方法更高的准确性,但在大多数实际应用中为了自动校正抖动伪像,而付出了更多的时间成本,此外高质量且具有完整标注的视频序列和大规模复杂环境的视频数据集都十分稀缺。本文研究了这种抖动伪影如何降低视频分割结果的视觉质量,发现以神经网络学习为主的算法受到标注质量的影响更大,人工在
Ⅱ型糖尿病是一种慢性代谢性疾病,影响全世界近1亿人。在过去的20年里,确诊患有Ⅱ型糖尿病的成人数量飞速增长。而对糖尿病患者来说,患病后可能会引起的其他并发症是医疗花费主要压力,也是造成患者死亡的最大因素。如果可以提前预测出糖尿病患者罹患并发症的情况,将给医生和患者提供很大的方便。也将大大降低医疗费用支出。当下医学上对于糖尿病并发症的检测,还停留在患者表现出症状以后再进行专门医学检测的阶段。一方面随
手部姿态估计在人机交互、交流表达、机器人抓取等众多场景具有重要应用,也是计算机视觉领域中的研究热点。由于彩色图像缺少绝对的深度信息,从彩色图像中估计手部姿态是一种高维非线性映射,同时人手本身具有自相似和自遮挡等问题,因此从彩色图像估计手部姿态仍然是一个充满挑战的任务。本文基于双目彩色图像对手部姿态估计进行分析和研究,研究内容主要分为以下三个部分:(1)针对从二维图像到空间坐标映射的不确定性问题,本
多目标跟踪是计算机视觉领域的研究热点之一,它在自动驾驶、视频监控、人机交互等领域被广泛应用。其主要任务是在一段视频序列中,将不同视频帧的同一个目标对应起来,每个目标形成不同的运动轨迹。主流的多目标跟踪技术几乎都是基于Detection-Based Tracking(DBT)框架,即先利用检测器识别出感兴趣的目标,再利用嵌入模型(Re-ID)预测目标外观的特征向量,根据检测结果与轨迹外观特征的相似度
近年来,随着光场技术的快速发展,基于多聚焦特征的光场深度估计方法取得了显著的进展。焦点堆栈图像记录了场景在不同深度下的聚焦程度。一系列聚焦在不同深度的焦点切片包含了丰富的空间视差信息,能够很好地揭示场景的三维结构。然而,在多聚焦特征提取中,传统方法存在鲁棒性差、精度低的缺点。现有基于卷积神经网络的方法仅仅利用标准卷积来学习可扩展到整个焦点堆栈的滤波器,忽略了焦点切片之间的空间相关性,导致复杂场景下
目标检测是计算机视觉领域中的一个基础性算法,促进了其他上层技术的发展,在自动驾驶、机器人导航和智能交通等多个领域得到广泛的应用。近年来,2D目标检测算法已经趋于成熟,但是3D目标检测算法尚处于发展阶段,模型的性能还有很大的提升空间,因此3D目标检测算法是计算机视觉领域研究的热点之一。针对3D目标检测算法,本文从锚框的设计、特征的增强以及多模态数据融合等方面进行研究,主要工作内容如下:(1)针对3D
随着我国经济社会的高速发展,国家对社会治安防控体系建设日益重视,监控摄像头的覆盖区域不断增加,但在基于监控视频的事件监测方面仍然存在不足。现有智能视频分析方法主要是从视频中获取特征,缺少与外界要素的联动和知识的导引,对事件分析不够系统全面,关键特征不突出。为此,本文针对治安监控视频下群体性事件监测,基于卷积神经网络改进群体性突发事件的关键特征提取方法,基于知识元表示提出融合视频特征的群体性事件监测
多元时间序列广泛存在于社会生活的各个领域,多个变量之间具有复杂的关联关系。分析多元时间序列变量间的相互影响关系,挖掘系统潜在的蕴含信息,对复杂系统的分析与建模具有重要的现实意义。本文以复杂系统的多元时间序列为研究对象,针对多变量间的因果关系展开研究,为预测模型构建合适的输入特征,最终达到精简模型、提高预测精度的目的。本文的研究内容如下:针对传统的Granger因果模型仅仅适用于二变量、线性系统,无