论文部分内容阅读
随着图像处理技术的不断发展,目标检测与语义分割逐渐成为研究的重点对象。室内场景与人类生活息息相关,因此室内场景下目标检测与分割具有重要的研究意义和现实应用前景。在目标检测与语义分割研究中,结合彩色和深度图像能更全面地整合场景中有效信息,具有一定优势。因此,本文从深度估计和多尺度特征融合角度出发,开展了室内场景下目标检测与语义分割的相关研究,主要研究内容如下:
在深度估计方面,针对立体匹配中不适定区域难以找到精确匹配点的问题,提出一种融合多尺度局部特征与深度特征的立体匹配方法。其中,特征融合阶段主要包括两部分,其一是提取Log-Gabor特征和局部二值模式特征组合的浅层次特征,并将不同尺度的特征进行融合;其二是利用卷积神经网络提取深度特征,之后再将多尺度浅层融合特征和深度特征进行级联,形成既包含语义信息又包含结构化信息的特征图像。此外,通过在极线垂直方向添加不同强度的噪声来构造正负样本,减小图像中不严格极线对齐带来的误差。将所提双目立体匹配模型与变体方法、经典方法在KITTI数据集上进行对比实验,验证了其在图像细节处理方面具有良好的表现,相比其它方法具有一定的竞争性。
在融合彩色和深度图像的目标检测方面,针对室内场景下目标检测中存在特征表达不足以及目标尺度差异大导致检测较难的问题,提出一种结合注意力机制和特征融合的目标检测方法。首先,采用非下采样轮廓波变换将彩色和深度图像进行像素级融合得到相关性特征,使得图像中区域特征更为明显,而且可以增强卷积神经网络对旋转不变的适应性。为了缓解彩色图像上提取的特征缺乏空间信息的问题,采用双流卷积神经网络分别提取彩色图像和相关性图像的特征,并在对应层进行多层感知机非线性融合。为了缓解图像中物体尺度差异较大的问题,采用注意力机制将不同特征层的特征图像进行选择性融合,得到具有特定表征的特征图像。将所提目标检测方法在NYUDv2数据集上进行实验,并与现有经典目标检测方法进行对比,从而验证了所提方法的合理性和有效性,在检测效果上具有一定的性能提升。
在融合彩色和深度图像的语义分割方面,针对室内场景下光照变化、物体相互遮挡以及存在大量语义类别等问题,提出一种基于双流Gabor卷积网络融合的语义分割方法。为了获得方向和尺度不变性特征,设计一种加权Gabor方向滤波器,以替代传统卷积滤波器,进而提取有利于语义分割的特征信息。此外,为了构建轻量级特征提取网络,采用宽残差模块分别提取彩色和深度图像特征,并采用金字塔池化模块对提取的特征进行多尺度融合,从而丰富图像上下文信息。将所提语义分割方法在NYUDv2数据集上进行实验,并与现有经典分割方法以及变体方法进行对比,验证了所提语义分割方法具有一定的性能提升,各个模块设置具有合理性。
在深度估计方面,针对立体匹配中不适定区域难以找到精确匹配点的问题,提出一种融合多尺度局部特征与深度特征的立体匹配方法。其中,特征融合阶段主要包括两部分,其一是提取Log-Gabor特征和局部二值模式特征组合的浅层次特征,并将不同尺度的特征进行融合;其二是利用卷积神经网络提取深度特征,之后再将多尺度浅层融合特征和深度特征进行级联,形成既包含语义信息又包含结构化信息的特征图像。此外,通过在极线垂直方向添加不同强度的噪声来构造正负样本,减小图像中不严格极线对齐带来的误差。将所提双目立体匹配模型与变体方法、经典方法在KITTI数据集上进行对比实验,验证了其在图像细节处理方面具有良好的表现,相比其它方法具有一定的竞争性。
在融合彩色和深度图像的目标检测方面,针对室内场景下目标检测中存在特征表达不足以及目标尺度差异大导致检测较难的问题,提出一种结合注意力机制和特征融合的目标检测方法。首先,采用非下采样轮廓波变换将彩色和深度图像进行像素级融合得到相关性特征,使得图像中区域特征更为明显,而且可以增强卷积神经网络对旋转不变的适应性。为了缓解彩色图像上提取的特征缺乏空间信息的问题,采用双流卷积神经网络分别提取彩色图像和相关性图像的特征,并在对应层进行多层感知机非线性融合。为了缓解图像中物体尺度差异较大的问题,采用注意力机制将不同特征层的特征图像进行选择性融合,得到具有特定表征的特征图像。将所提目标检测方法在NYUDv2数据集上进行实验,并与现有经典目标检测方法进行对比,从而验证了所提方法的合理性和有效性,在检测效果上具有一定的性能提升。
在融合彩色和深度图像的语义分割方面,针对室内场景下光照变化、物体相互遮挡以及存在大量语义类别等问题,提出一种基于双流Gabor卷积网络融合的语义分割方法。为了获得方向和尺度不变性特征,设计一种加权Gabor方向滤波器,以替代传统卷积滤波器,进而提取有利于语义分割的特征信息。此外,为了构建轻量级特征提取网络,采用宽残差模块分别提取彩色和深度图像特征,并采用金字塔池化模块对提取的特征进行多尺度融合,从而丰富图像上下文信息。将所提语义分割方法在NYUDv2数据集上进行实验,并与现有经典分割方法以及变体方法进行对比,验证了所提语义分割方法具有一定的性能提升,各个模块设置具有合理性。