基于双目图像的语义分割和视差估计技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:thangna9806
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是指对图像中每个像素进行分类,为其指定一个类别标签使其与真实存在的物体或概念相联系。而视差估计是指输入双目数据,为全部或部分像素找到其在两个视角上的相对关系并求出其偏移量。视差可以很容易地被转换为深度数据从而构建场景的局部三维模型,结合语义分割模型可以实现物体的像素级别定位。本文将两者的结合称为2.5D语义分割。2.5D语义分割可以被应用于多个领域,如:自主导航机器人的场景感知、增强现实中的传感器定位、国防安全中的雷达图像自动化分析等。随着深度卷积神经网络(Deep Convolution Neural Network,DCNN)的引入,语义分割、视差估计算法的性能取得了重大突破,研究人员在原始DCNN的分类功能上逐渐研究其对图像语义分割以及视差估计的应用。近年来,基于DCNN的语义分割网络以编解码为结构基础对图像进行特征抽象与语义细节恢复。视差估计任务方面经历了从以编解码为结构基础的特征提取与视差细节恢复网络到基于孪生神经网络的特征提取与匹配网络的转变。同时随着网络结构越来越复杂高效,数据集也被大量提出来推进相关工作。本文针对当前存在的场景理解数据集进行调研分析,提出了一个大规模双目室内场景理解数据集。同时基于数据集提出成了端到端的2.5D语义分割网络。本文从数据集生成、网络模型构建、训练策略等几个方面展开深入研究:(1)大规模双目场景理解数据集的生成:本文以当前公开的三维场景模型数据集为基础,结合机器人运动的实际情况来设计空间中相机运动准则,指导相机在场景中进行全局的路径导航。针对导航结果对场景进行筛选并排序,按照顺序进行基于光线跟踪的图像渲染。本文对5,414个场景进行了路径规划,渲染了包含312个场景的222,778个位姿点的双目RGB数据以及双目语义分割与深度的真值标签。并经过统计,语义分割的像素分布与真实数据保持一致,确保了数据集的合理性。(2)2.5D语义分割网络的设计与实现:本文结合当前最优的语义分割、视差估计网络的设计优点,提出了端到端的2.5D语义分割网络,能够同时输出语义分割和视差估计结果。网络由特征提取器、语义分割分支、视差提取分支三个部分构成。特征提取器以残差网络(Residual Networks,Res Net)中的残差单元为基础进行构建,双目输入图像被特征提取器分别处理而构成孪生神经网络结构,在不同的分辨率上得到左右图像双目特征。双目特征被分别以空间金字塔池化和代价簇(cost volume)进行处理得到多尺度的语义分割特征以及包含深度信息的视差估计特征。两个特征被分别以语义分割分支和视差估计分支进行进一步处理同时输出语义分割和视差估计结果。之后,本文针对2.5D语义分割网络的多任务本质,从训练策略上确定了最优的网络构建方案,同时进一步引入多目标损失函数来提升网络性能。本文通过大量对照实验,确定了本文提出的数据集对于语义分割任务的训练能够提供有效图像信息,同时确定了最优的训练策略。使得2.5D语义分割网络能够兼顾两个任务输出较高精度的结果。同时本文通过实验表明,提出的多目标损失函数有效地提升了语义分割的指标成绩,达到了89.012%,在视差估计上的误差指标达到1.21像素。同时实验表明,本文应用的多目标函数使得视差估计能够受到语义监督的约束,为进一步的研究提供了研究方向。
其他文献
思想政治理论课(简称“思政课”),作为高校开展思想政治教育的主渠道和主阵地,是一门落实立德树人根本任务的关键课程。如何高效开好这门课程,成为当下亟待解决的问题。实践教学,作为思政课教育教学中非常重要的一部分,对思政课的育人效果产生着极为重要的影响。本文以一种系统全面的视角,将高校思政课实践教学视作一个统一体,深入分析其组成的不同要素以及要素间的相互关系,接着选取云南部分高校作为调查对象,试图去研究发现当下云南高校在思政课实践教学发展过程中存在的问题以及解决这些问题的对策,
学位
川上弘美,日本当代颇具名气的女作家,以其极具想象力而又清新的写作手法在日本文坛占据一席之地,1994年出道即以短篇小说“神灵”荣获柏斯卡短篇文学奖,自此,创作并出版了多篇小说,并斩获了紫式部文学奖、芥川奖、谷崎润一郎奖等重要奖项。1998年,处女作“神灵”与“河童玉”、“草原上的午餐”等9篇一起被收录进短篇小说集《神灵》,该书获得了第九届紫式部文学奖以及第九届Bunkamura杜马戈(ドゥマゴ)文
师幼互动是教师与幼儿之间的人际互动,它是幼儿在幼儿园学习与生活的主要影响方式。学前儿童数学教育是科学领域的主要内容。数学知识的抽象逻辑性决定了良好的师幼互动是冲破教师与幼儿在数学教学活动中抽象逻辑思维矛盾的桥梁。这样才能实现幼儿在与教师互动交往中获得数学经验,培养逻辑思维能力,实现幼儿园数学教育质量,最终实现学前儿童数学教育的目标。师幼互动是儿童发展和学习的最主要机制,也是衡量教育质量的核心要素,
学位
终身学习已经成为当代人的共识。越来越多的人开始在学习、工作和生活之余选择多种多样的方式和手段获得知识,随时为自己充电,不断提升自己的知识水平和业务能力。与此同时,人们也发现,尽管每个人都在努力,但是,最终导致的结果依然存在巨大差别,受到各种诸如运气,机会等外部因素的限制,这些因素大多数属于非个人能力方面,比如自我效能感等,本课题即以此为研究方向,以学生自我效能感等非智力结构因素作为研究重点,探讨自
学位
人工智能技术应用对于提高创新力和发展动力十分关键,人工智能技术、互联网应用、大数据应用、物联网等新技术正快速发展,5G通讯、智能企业、智慧城市不断改变着人们生产生活方式。中央和各地方为此制定了许多有关人工智能领域政策,对这些政策文件进行分析研究具有极其重要的意义。本文通过对我国人工智能领域政策收集和整理,筛选出64条政策文本,先从政策制定时间、制定主体、文本类型、文本关联度上分析。随后构建以政策工
已有研究表明民族认同、社会适应性和学生的心理健康的关系极为密切。目前,针对哈尼族初中生民族认同、社会适应性与心理健康的关系研究还未见,所以本研究着重对此进行探讨。本研究选取499名哈尼族初中生为研究被试,使用“中学生的民族认同量表”、“中学生社会适应性量表”、“中国中学生心理健康量表(注:心理健康问卷得分越高,心理健康水平越低)”进行调查,经过数据分析,得到如下结论:(1)哈尼族初中生民族认同、社
学位
随着社会经济的不断发展,我国的电网结构正发生着重大变化。一方面,光伏、风电等分布式能源广泛接入使得电网的潮流分布发生了改变,对交流系统的供电稳定性造成巨大冲击。另一方面,在经济高速发展条件下,国民用电负荷飞速增长,原有配电网负担加大;直流负荷广泛应用,接入电网中需要进行交直流转换,供电效率降低。本文搭建出一套典型的两端直流配电系统。综合考虑经济性跟供电稳定性等因素,选择出合适的电压等级、拓扑结构以
目前,全国拥有地铁运营线路的城市有38个,城市之多和线路之长都位居世界前列。城市轨道交通目前处于稳步增长阶段,高铁、地铁建设对于高质量的盾构管片有着巨大的需求。京张高铁第一长隧道正盘台隧道因其特殊的地质条件,对管片支架的质量有着近乎严苛的要求。截止到2018年年底,中国国内市场的盾构项目逐步增多,北京盾构管片厂家已有6家,郑州这一枢纽城市厂家增加到13家之多,这意味着国内市场的份额在逐步扩大。因此
近年来,随着城市化进程的不断推进,外来务工人员呈家庭化趋势涌入城市,外来务工人员子女数量也不断增多。外来务工人员子女在适应学校新生活的过程出现的问题不容忽视。本研究旨在了解外来务工人员子女父母教养方式、学校归属感和学校适应性的现状和特点,并探讨三者的关系,从父母教养方式与学校归属感两方面入手,为家长和教育工作者有效促进外来务工人员子女适应学校生活提供对策,从而帮助外来务工人员子女更好地适应新的学校
学位
红脂大小蠹Dendroctonus valens是我国松树上严重发生的一种外来入侵害虫,主要以幼虫钻蛀油松、樟子松等松属干部和根部进行侵害,导致松树生长受碍,甚至整株枯死。红脂大小蠹主要以成虫和老熟幼虫在松树根部越冬,自1998年从美国传入我国山西后,正在不断的向北扩散到内蒙、辽宁等地,其耐寒能力逐渐增强。由于热激蛋白可以促使因外界刺激而错误折叠的肽链进行重新折叠,为了明确热激蛋白在红脂大小蠹抵御