微小基线输入下的深度获取及优化技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：yl2590

【摘要】

：

随着5G网络的试商用,极高的网络传输速率使得终端设备可以轻松获得云端的计算和存储资源,这为移动终端视觉应用的发展提供了有力的保障。由于三维信息对大量视觉应用十分重要

【作者】

：

陶秋琰

【出处】

：

浙江大学

【发表日期】

：

2004年期

【关键词】

：

深度图估计微小基线立体匹配运动结构恢复深度填补深度超分辨率恢复回归森林卷积神经网络平面加视差捆集约束条件随机场

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着5G网络的试商用,极高的网络传输速率使得终端设备可以轻松获得云端的计算和存储资源,这为移动终端视觉应用的发展提供了有力的保障。由于三维信息对大量视觉应用十分重要,智能手机厂商通过配置双摄像头或增加深度传感器获取静态拍摄时的场景结构信息,苹果和谷歌公司分别推出了不同平台的SDK实现运动相机下的场景结构获取,用于支持基于移动终端的增强现实应用开发。但是,移动终端较小的双摄基线和较小的相机运动尺度会导致深度不确定度的增加,从而增加了移动终端的场景结构估计的难度。在这个背景下,本文提出了微小基线输入下的深度获取和优化这个研究课题。在计算机视觉领域,基线是指拍摄两幅图像的相机光心之间的连线距离。相机之间的基线减小会使得深度估计的不确定性呈平方递增。对于双目立体问题,微小基线输入对视差估计的精度要求提高了。对于多视图几何问题,这样的输入使得对极几何的相关算法失效。因此,微小基线输入下的深度获取是通用场景结构获取问题的一种特别情况,不能直接采用立体匹配、运动结构估计和基于视觉的同时定位与建图技术中成熟的方案,而需要根据微小基线输入的特性进行重新考虑和设计。本文针对微小基线输入的特殊性,提出了基于双目、单目多帧的深度估计算法和深度后处理优化算法,在精度、速度和鲁棒性等多方面提升了深度估计结果,并给出了相应的应用场景和效果。本文提出的算法将近年来流行的学习方法融入视觉领域的一些传统方法,不仅有效克服了传统方法原本的缺陷,还在微小基线输入下超越了目前经典算法的性能。本文的主要创新点和贡献总结如下:1.本文提出一种基于频域相位回归的视差估计方法用于微小基线下的立体匹配问题,得到的视差估计精度相比于传统的相位方法提升了一个数量级,并在微小基线双目输入这种特定的条件下超越了基于代价估计和聚合的主流立体匹配方法。本文提出的方法将立体匹配问题转化为频域中的相位差回归问题。通过复值方向金字塔进行时频变换并筛选得到多方向多尺度的相位差信息,然后使用学习方法充分利用相位差的冗余度和局部梯度信息进行视差回归。该方法将适合微小基线输入的域变换与数据驱动的机器学习结合,克服了域变换方法固有的系统误差,从而提升了视差估计的精度。2.针对微小基线下的单目多帧输入,本文提出了两种不同的方法克服深度估计不确定性增加带来的对极几何失效问题。第一种方法是基于点线特征的联合优化法,通过增加线特征匹配提升了系统的鲁棒性和精度,通过传播的方式加速了深度稠密化步骤。这种方法无需提前标定相机内外参,用匹配特征在无畸变的图像坐标系下构建联合捆集优化方程并求解,能够同时得到相机内参、相对运动和稀疏点云结果。在联合优化中加入了线特征,能够弥补点特征在缺乏纹理的区域难以检测匹配的问题,既增加了捆集约束的鲁棒性,又提升了深度图在直线边缘的精度。另外,本文提出的基于传播的深度图稀疏到稠密方法,将深度稠密化步骤的时间缩小为原来的10%。3.本文提出的第二种微小基线下的深度估计方法是平行参考平面法。该方法使用低秩矩阵分解替代捆集优化直接进行稠密深度的估计,大大降低了算法的总计算时间,有效平衡了深度估计的速度与性能。该方法受到因子分解法和平面加视差框架的启发,根据微小基线输入的特点进行了如下设计:首先,简化了运动模型的表达和求解;其次,使用坐标变换误差最小化和图像块的光度误差最小化估计参考平面的点和运动;另外,本文还提出了基于几何相似度的参考平面平行程度的误差度量方式和基于观测矩阵特征值比值的质量评价方式。上述操作保障了基于参考平面的运动视差估计结果,从而保障了参考相机视角下的相对深度图质量。相比联合优化类方法,该方法将计算时间从分钟级降为秒级。4.最后,本文提出了一种基于混合信息的深度优化框架,用于深度图空洞填补和超分辨率恢复。该方法结合了卷积神经网络的非线性映射能力和条件随机场模型的离散优化特点,得到了高精度的深度超分辨率结果,并且在边缘的准确度方面有明显优势。在本方法中,基于条件随机场的推断不仅仅依赖彩色信息,还采用不同的处理方法从低质量的深度图中获取高质量深度图所需的不同特征信息:选择最近邻作插值得到的深度定义先验状态势函数、将卷积神经网络得到的超分辨率结果和彩色信息一起用于定义转移特征函数、使用双线性插值的深度梯度信息定义掩模进行更新区域的控制。该方法控制了输入标签数目、有效抑制了彩色和深度不一致带来的误差,从而得到了高精度的结果和清晰的深度边缘。

其他文献

淹城春秋乐园

<正>阳春三月,笔者走访了常州淹城春秋乐园。整个园区既是一块绿色的大地,也是一个植物的群落馆。它从设计到建设,保留了原始的历史文物元素,只是根植了一些低矮的树木,没有

期刊

春秋时期

课程标准视角下高校体育舞蹈教学改革探究

高校人才培养当中,一直都非常重视学生身体素质的培养,因此也十分重视体育课程。学生在大一、大二期间必须选择一门体育课程,当然学校开设的体育课程也是多样的,学生拥有充分

期刊

课程标准高校体育体育舞蹈教学改革

冻疮外洗方一则

冻疮外洗方一则河北省尚义县医院（０７６７５０）张文治冻疮，即因冻而生疮。乃寒袭肌肤后，寒滞经络，阻遏气血流通，故病发皮肤青紫肿胀疼痛，或奇痒难忍。如愈后复发，每到冬季患处症状如故，即为经年冻

期刊

外洗方河北省尚义县气血流通肿胀疼痛

超表达中间锦鸡儿CiHARBI1基因影响转基因拟南芥子叶形态建成

器官形状的控制是一个基本的发育生物学过程,截至目前,植物器官形状的调控机制仍未被阐明。叶是植物体的基本营养器官,其形态结构的改变很大程度上影响植物对非生物胁迫信号

学位

中间锦鸡儿HARBI1子叶扁平细胞形态建成生长素细胞分裂素

拆掉学校间的“围墙”

通过教育城域网，南阳市可以整合全市教育系统的各种资源，形成一个巨大的资源库。广大师生只要鼠标轻轻一点，就可以轻松实现管理、通讯、学习、交流、创作、娱乐六大功能。

期刊

教育城域网网络中心教育局服务器南阳市城域网建设机群管理瘦客户端

辅导员如何开展就业指导

高校辅导员在大学生就业指导工作中承担着非常重要的角色,随着社会就业形势的不断变化,对高校辅导员的就业指导工作提出新的要求。本文就辅导员开展就业指导工作的优势、如何

期刊

辅导员就业指导

中国户籍制度改革的动力与阻力研究

中国的户籍制度改革在新世纪以前进展缓慢,在新世纪以后却有较为明显的实质性突破。但与此同时,仍有很多地方政府在具体实施户籍制度改革时表现出了迟疑甚至反对。鉴于这一现

学位

户籍制度动力阻力有限理性劳动力结构劳动力市场供求状况刑事犯罪收入

《华盛顿邮报》对“邮件门”事件报道的内容分析

在美国大选的背景下研究"邮件门"事件的媒体呈现具有时新性,本文选取美国老牌传统媒体《华盛顿邮报》,主要研究其对"邮件门"事件报道的内容呈现。通过在《华盛顿邮报》官网上

期刊

“邮件门”事件《华盛顿邮报》报道特点内容分析法危机传播

观察夹板粘接固定法用于治疗儿童前牙外伤的疗效

目的观察在儿童前牙外伤治疗过程中应用夹板粘接固定法的治疗效果。方法34例儿童前牙外伤患儿均采用夹板粘接固定法进行治疗,评价其治疗效果。结果本组34例儿童外伤前牙(恒牙

期刊

夹板粘接固定法儿童前牙外伤治疗效果

数学文化：数学教学的美丽邂逅

数学是人类的一种文化,它的内容、思想、精神、方法、观点、语言都是现代文明的重要组成部分。数学教师应通过数学文化层面的教育,让学生进一步理解数学、喜欢数学、热爱数学

期刊

数学文化价值数学素养

微小基线输入下的深度获取及优化技术研究

与本文相关的学术论文