基于深度估计与特征融合的室内目标检测与语义分割

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kxianwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像处理技术的不断发展,目标检测与语义分割逐渐成为研究的重点对象。室内场景与人类生活息息相关,因此室内场景下目标检测与分割具有重要的研究意义和现实应用前景。在目标检测与语义分割研究中,结合彩色和深度图像能更全面地整合场景中有效信息,具有一定优势。因此,本文从深度估计和多尺度特征融合角度出发,开展了室内场景下目标检测与语义分割的相关研究,主要研究内容如下:
  在深度估计方面,针对立体匹配中不适定区域难以找到精确匹配点的问题,提出一种融合多尺度局部特征与深度特征的立体匹配方法。其中,特征融合阶段主要包括两部分,其一是提取Log-Gabor特征和局部二值模式特征组合的浅层次特征,并将不同尺度的特征进行融合;其二是利用卷积神经网络提取深度特征,之后再将多尺度浅层融合特征和深度特征进行级联,形成既包含语义信息又包含结构化信息的特征图像。此外,通过在极线垂直方向添加不同强度的噪声来构造正负样本,减小图像中不严格极线对齐带来的误差。将所提双目立体匹配模型与变体方法、经典方法在KITTI数据集上进行对比实验,验证了其在图像细节处理方面具有良好的表现,相比其它方法具有一定的竞争性。
  在融合彩色和深度图像的目标检测方面,针对室内场景下目标检测中存在特征表达不足以及目标尺度差异大导致检测较难的问题,提出一种结合注意力机制和特征融合的目标检测方法。首先,采用非下采样轮廓波变换将彩色和深度图像进行像素级融合得到相关性特征,使得图像中区域特征更为明显,而且可以增强卷积神经网络对旋转不变的适应性。为了缓解彩色图像上提取的特征缺乏空间信息的问题,采用双流卷积神经网络分别提取彩色图像和相关性图像的特征,并在对应层进行多层感知机非线性融合。为了缓解图像中物体尺度差异较大的问题,采用注意力机制将不同特征层的特征图像进行选择性融合,得到具有特定表征的特征图像。将所提目标检测方法在NYUDv2数据集上进行实验,并与现有经典目标检测方法进行对比,从而验证了所提方法的合理性和有效性,在检测效果上具有一定的性能提升。
  在融合彩色和深度图像的语义分割方面,针对室内场景下光照变化、物体相互遮挡以及存在大量语义类别等问题,提出一种基于双流Gabor卷积网络融合的语义分割方法。为了获得方向和尺度不变性特征,设计一种加权Gabor方向滤波器,以替代传统卷积滤波器,进而提取有利于语义分割的特征信息。此外,为了构建轻量级特征提取网络,采用宽残差模块分别提取彩色和深度图像特征,并采用金字塔池化模块对提取的特征进行多尺度融合,从而丰富图像上下文信息。将所提语义分割方法在NYUDv2数据集上进行实验,并与现有经典分割方法以及变体方法进行对比,验证了所提语义分割方法具有一定的性能提升,各个模块设置具有合理性。
其他文献
摘要:2010年3月到5月,我国发生了多起针对校园的个体极端事件,造成众多学生的伤亡,令人痛心。由此,社会性弱势群体问题引起了人们的普遍关注。运用社会公平复合理论的基本观点对这些校园个体极端事件进行分析,提出正确对待社会性弱势群体的公平问题,并指出社会性弱势群体不公平现状的解决途径。  关键词:社会公平复合理论;社会性弱势群体;问题症结;解决途径  中图分类号:D035 文献标志码:A文章编号:1
期刊
摘要:在老子思想中“无为”这两个字,基本上可以涵盖老子思想的实质和精华。在很多人眼里,无为就是老子和老子思想的代名词。一提到老子,人们都会很快地想起“无为”这两个字。老子的无为之论,可以讲是对人类所有想象和行为以及一切有为的超越、制衡和批判。就这一点,无为之论就具有重大的理论意义和实践价值。而且老子的“无为而治”并不是无所作为,其实质是一种不违背自然规律的积极有为的思想,是一种在何时“有为”、在何
期刊
高光谱遥感影像“图谱合一”,为精准实现地物识别与分类提供了可能。但是,较高的光谱分辨率致使其波段数多、数据复杂,从而造成“维数灾难”。故而,如何在降低数据冗余的同时尽可能地保留原始数据中的有效信息,是目前高光谱遥感影像地物分类研究中的关键。
  特征提取是解决“维数灾难”的有效途径,通过特征提取,可降低数据冗余,获得更有解释性的特征,改善分类效果。针对大多传统算法均假设高光谱数据分布于单流形结构而未考虑复杂的多流形特性以及仅依赖光谱信息而忽略空间信息的不足,本文以高光谱影像数据的内在结构为视点,结合
摘要:在《麦当劳梦魇——社会的麦当劳化》中,乔治·瑞泽尔运用马科斯·韦伯理性化理论分析当今社会中的快餐文化是如何渗透并影响人们的工作与生活的,并对这种“理性的非理性化”潮流予以批判。基于该书内容,联系相关社会学理论进行评述,对“麦当劳化”概念进行思维拓展,具有很强的理论和现实意义。  关键词:麦当劳化;工具理性;理性化;非理性;生活世界殖民化  中图分类号:C911 文献标志码:A文章编号:167
期刊
摘要:新疆高校大学生学术型社团是实施素质教育的重要途径和有效平台,在提高学生专业素养、促进优良学风、丰富校园文化、完善新疆高校社团建设等方面发挥着重要作用。拟以新疆农业大学为例,探讨新疆高校大学生学术型社团的定位、功能、意义,并针对社团建设中存在的问题,提出完善建议。  关键词:学术型社团;新疆农业大学;建设  中图分类号:G647 文献标志码:A文章编号:1673-291X(2011)08-01
期刊
高光谱遥感影像通常由几十到数百个光谱波段组成,这些光谱波段的反射比值一起组成了每个像元的光谱曲线。相同类型的像元一般具有相似的光谱曲线,而不同类型的像元的光谱曲线通常存在差异。利用这一点,可以区分不同的像元所属的地物种类,揭示像元对应的地面目标的内在属性。高光谱遥感影像既可以用于对不同物体进行分类,也可以用来帮助观察矿物含量、土壤湿度、植被健康、建筑组成以及其它肉眼不可见的细节。但是,较高的光谱维数,在带来丰富信息的同时,也存在休斯现象。因此,对高光谱遥感影像进行分类处理时,怎样从高维数据中提取出有效特征
MEMS压电薄膜超声换能器(PMUT)作为高端超声检测仪器的核心传感部件,是推动工业制造、能源化工、医疗卫生和国防军事等应用领域的典型检测仪器发展的关键。其研究可为水下声学探测和智能互联中语音识别等领域的声压传感器应用提供共性技术支撑,可促进高精度声学检测设备技术的发展。相较于其它超声换能器,基于AlN压电薄膜的MEMS压电薄膜超声换能器与CMOS工艺兼容良好,制备过程绿色环保,声匹配性相对较好,具备较高性能表现以及较低的能量损耗,可以应用在极端工作环境中,但其技术壁垒相对较高、研发难度较大。本文开展了以
摘要:近年来,中等职业教育围绕国家经济社会发展需求,推动了社会对职业人才的需求与重视。目前的形势是,一方面,为我国的职业教育提供了前所未有的发展机遇,尤其是中等职业教育的规模逐渐发展壮大;另一方面,由于多年来高中、高校都在大规模扩招,导致中等职业学校的生源质量普遍下降。面对新形势,如何构建教学质量控制机制,提高人才培养质量,成为中等职业学校面临的新问题。为此,拟以平顶山市卫生学校为例进行探讨。  
期刊
摘要:群体性纠纷是近年困扰我国各级政府的一大难题,虽然很多群体性纠纷最终得到了化解,但是却历经很多周折,面对化解群体性纠纷存在的诸多困境,必须寻找有效的应对策略,减少群体性纠纷的发生,提高化解纠纷的效率。  关键词:群体性纠纷;困境;应对策略  中图分类号:C913 文献标志码:A文章编号:1673-291X(2011)08-0208-04    随着改革开放的不断深入,中国社会已进入转型时期,各
期刊
摘要:加强和改进社区党建,成为时代赋予党的基层组织建设的新课题。临洮县各级党组织主动适应经济社会发展和群众利益格局的新变化,高度重视社区党建工作,但在工作中也存在着一些不容忽视的问题。结合临洮县洮阳镇社区党建工作实际,要把社区党建作为重要的基础工程来抓,加强优秀共产党员先进事迹的报道力度,把服务群众的工作做深做细,不断探索和创新服务群众的有效途径,切实提高为群众服务的能力和水平;要不断增强党组织的
期刊