【摘 要】
:
光场相机通过对单个场景进行多视角密集采样,使得高精度深度信息的挖掘成为可能,在深度传感器中不论在便携性还是深度精确性方面都具有显著优势。现有的深度估计方法不能很好处理遮挡和噪声问题,特别是对于包含遮挡区域的噪声场景,遮挡和噪声的同时存在将使深度获取难度进一步加大。本文分别围绕遮挡和噪声这两大难点问题对光场深度估计展开研究。论文的主要研究工作如下:(1)概述光场深度估计原理以及国内外的应用场景和研究
论文部分内容阅读
光场相机通过对单个场景进行多视角密集采样,使得高精度深度信息的挖掘成为可能,在深度传感器中不论在便携性还是深度精确性方面都具有显著优势。现有的深度估计方法不能很好处理遮挡和噪声问题,特别是对于包含遮挡区域的噪声场景,遮挡和噪声的同时存在将使深度获取难度进一步加大。本文分别围绕遮挡和噪声这两大难点问题对光场深度估计展开研究。论文的主要研究工作如下:(1)概述光场深度估计原理以及国内外的应用场景和研究现状。介绍了主动式和被动式光场传感器以及空序和时序光场数据采集方式。以微透镜型光场相机为基础,分析了不同的光场参数化表示方式,阐述了基于多视角匹配、多视角图、极平面图像和焦堆栈等线索的深度估计方法原理,分析了各个方法的特点,并针对这些方法在抗遮挡以及抗噪声的性能及存在的问题进行了分析与总结。(2)针对目前光场深度估计方法存在的遮挡问题,提出了3D遮挡模型引导的抗遮挡深度获取方法。方法通过向2D模型中的不同物体之间添加前后景关系和深度差信息,以构建场景的立体模型,使得高精度遮挡图的获取成为可能。在遮挡图的引导下,方法在遮挡区域和非遮挡区域分别使用更加契合区域特性的成本量进行深度估计,充分发挥了基于不同线索的成本量的优势。为充分发掘遮挡图和深度图的依赖关系,方式在使用所提出的基于EM的联合优化框架的基础上,利用两者互相引导的方式进一步提升彼此精度。实验结果表明3D遮挡模型相比传统2D遮挡模型更适用于复杂遮挡场景的深度估计。(3)针对目前深度估计方法无法较好处理遮挡和噪声的问题,提出了基于内联遮挡处理的抗噪抗遮挡深度估计方法。方法采用内联遮挡处理框架,通过将遮挡处理集成进抗噪成本量中,在保证抗噪性能的同时提升算法的抗遮挡能力。为克服传统滤波方法无法保留图像边缘的缺点,方法采用提出的适应遮挡的多模板滤波策略对成本量进行遮挡感知优化,在滤除噪声的同时有效避免了前后景混淆现象。实验结果表明,相比其它先进深度估计方法,该方法在高噪场景下具有显著优势,并能更好处理噪声场景深度估计的遮挡问题。
其他文献
目标检测作为计算机视觉领域的重要任务,无论在学术界还是工业领域都备受关注,在现实生活中诸多方向上都应用了目标检测技术,如自动驾驶、智能监控和三维重建等。基于卷积神经网络的目标检测模型在检测任务上表现出优越的性能,然而网络层数和各种性能提升模块的堆叠,带来高准确性的同时也降低了检测速度,作为实时目标检测算法YOLOv3通过改进残差网络,在速度与精度上实现了较为完美的平衡。所以,基于YOLOv3对残差
城市绿地资源对支撑经济社会发展规模,维持良好生态系统发挥着越来越重要的作用,但城市绿地资源信息管理工作仍存在着资源分散,管理平台整合度低,业务协调度低,城市相关绿地信息资源共享不够等问题。本文通过收集研究区的绿地资源以及相关基础地理和环境资源数据,建立研究区基础地理与资源数据库,综合利用GIS技术和互联网开发技术,通过平台架构设计及关键技术的研究,基于WebGIS技术,采用“SOA”面向服务架构思
傅里叶叠层显微成像技术(Fourier ptychographic microscopy,FPM)是一种可以同时兼顾高分辨率和大视场的新型成像技术,它主要是由结构照明、叠层成像、相位恢复三大部分组成。在基于LED阵列照明作为光源的传统FPM系统中,通过依次点亮光源阵列中的LED,由于各位置LED对样品的照射角度不同,可以采集一组包含不同频域信息的低分辨率图像,这些图像随后通过相位恢复算法,在傅里叶
随着物联网(Internet of Things,Io T)以及边缘计算的发展,数据安全问题逐渐成为研究热点。由于Io T场景复杂多样且存在较多资源受限平台,传统的密码算法难以进行有效部署。针对已有的认证加密方案资源消耗大的问题,本文采用轻量级分组密码算法与伽罗华/计数器模式(Galois/Counter Mode,GCM)相结合的方案,实现了Io T场景下的轻量级认证加密引擎。本文在深入研究GC
当下网络技术不断创新,互联网行业自身发展趋于成熟,与各领域的关系愈发密切,互联网产品数量呈爆发式增长,导致产品同质化严重、用户流失、获客成本高昂等问题。用户使用APP过程中的决策行为,是APP用户的长期稳定使用产品的关键。聚焦APP用户不同决策场景与阶段的情感体验,以情感代入的方式来引导APP用户使用中的决策行为,维持良好的情感关系,形成稳定的使用习惯,是本文研究的重点。本文基于APP用户情感代入
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算机视觉领域具有广泛应用。目前,基于深度学习的光场深度估计性能得到了显著提升,但随着输入成本的增加以及网络的加深,现有的光场数据集难以支持大规模网络的训练。同时,经过合成场景训练后的网络,在真实场景下的估计效果不佳。围绕上述问题,本文对光场重聚焦原理以及EPI图像进行分析,开展光
随着互联网时代的发展,信息安全问题日益突出,数字水印作为版权保护和身份认证的手段备受关注。它常用于地质勘察和军事通信等领域。为了保护勘察信息,同时避免图像被恶意盗取和篡改,人们将需要保护的信息当作水印嵌入到图像中。又由于户外勘察会受到天气的影响,遇到雾霾天气时会使拍摄到的图像质量降低。为了提高图片的质量,去雾也成为研究的热点问题。针对以上问题,本文提出一种基于去雾加速器的数字水印系统,在去雾的同时
目前,全国主要的医疗机构基本上都搭建各自的网上预约挂号系统或者电话挂号系统,但是从近些年的运行效果来看,预约挂号的放号量和使用率都不高。而且存在一些问题,如上办事大厅虽然有统一接入平台,但是预约挂号的提示不明确,医院出诊表不统一,存在各式各样现象,人机交互程度较差,群众使用起来极为不便等问题,有些还是单一PC端网站预约挂号平台,这些平台已难以满足患者的需求。随着移动互联网技术已经突飞猛进发展,预约
生物特征识别技术是最有效的个人身份认证解决方案之一。随着生物特征识别技术的广泛应用,生物特征识别数据库的规模不断扩大。在这种情况下,快速匹配和检索技术越来越有必要。掌纹识别技术是近年来新兴的生物识别技术之一。在掌纹识别技术中,有多个子类别,包括低分辨率掌纹识别和三维掌纹识别技术等。研究者们已经提出许多掌纹识别算法。而对快速的掌纹检索的算法研究还处于起步阶段。哈希技术是最流行的图像检索技术之一,由于
随着科技的发展和公共安防需求的增加,智能监控系统的部署成为了一种流行趋势,其核心是行人再识别技术。本文首先简要介绍了行人再识别研究的意义、现状、挑战;接着深入研究行人再识别的理论知识,概述了行人再识别发展至今的经典算法;然后针对行人图片错位、遮挡、无关信息干扰等问题,对融合全局特征与局部特征的行人再识别算法进行研究,以上述两种类型特征的有效提取方法为切入点,做了以下研究工作和算法创新。第一个工作是