基于自监督学习的光场EPI图像深度估计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:addegoflywzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算机视觉领域具有广泛应用。目前,基于深度学习的光场深度估计性能得到了显著提升,但随着输入成本的增加以及网络的加深,现有的光场数据集难以支持大规模网络的训练。同时,经过合成场景训练后的网络,在真实场景下的估计效果不佳。围绕上述问题,本文对光场重聚焦原理以及EPI图像进行分析,开展光场深度估计的研究。主要内容总结如下:(1)总结当前光场深度估计和自监督学习的研究背景及现状,介绍光场成像的基本理论,并阐述基于光场子孔径图像、EPI图像以及重聚焦线索的深度估计基本原理。(2)研究并设计一种基于光场重聚焦的EPI数据增强方法。通过对重聚焦前后场景视差与EPI斜率之间的关系进行分析,在同一场景点下,提取不同斜率的极线图并计算极线的视差值,增加深度估计网络的样本数据。实验结果验证了视差偏移量与极线斜率之间的变化关系。(3)结合自监督学习的训练方式,实现基于光场EPI图像的深度估计。根据EPI图像的结构特性,融合极线的关联性特征,构建基于EPI图像的关系网络。通过对重聚焦前后场景的视差偏移量进行估计,进一步实现网络的自监督训练。实验结果表明,该方法在复杂多遮挡的场景下获得了较高的估计精度,在真实场景下也具有明显优势。
其他文献
随着云服务的广泛运用,云服务提供商需要不断提高服务质量,并降低运营成本。云数据中心的极度复杂性使得软硬件故障频繁发生,并进而导致巨额损失。但是,应对软硬件故障的容错机制都不可避免的会增加包括能耗在内的云计算系统成本。因此,服务质量、能量消耗和可靠性已成为云服务提供商和用户关注的焦点。针对上述问题,迫切需要高效的任务部署策略,将任务部署到合适的云数据中心服务器上,从而提高云数据中心的服务质量、能源效
行人重识别作为视频监控安防领域的关键技术,由于其对视频智能分析展现出的优异性能,近年来受到工业界与学术界的越来越多的关注。有监督行人重识别方法当前已经取得了较为理想的性能表现,而跨域行人重识别方法仍存在较大的改进提升空间,行人重识别技术实际跨境头应用场景下会遇到目标数据无标签的问题,同时已有模型对新的数据不具备类别学习能力。因此,本文从已标注与无标注行人重识别数据域关联的角度出发,提出一种基于域自
微波介质陶瓷作为滤波器、谐振器和天线的核心材料,在通信行业中发挥着重要的作用。特别是近年来,第五代(5G)通信网络和无线系统逐渐融入人们生活的方方面面,导致微波介质陶瓷行业井喷式增长。为了满足5G通信的高通量需求,新型高频微波介质元件的研究与设计越来越受到人们的关注。本文采用传统固相反应法制备了温度稳定的0.95CaSm AlO4-0.05Sr2TiO4(CSAST)陶瓷,并研究了CSAST陶瓷和
血压是诊断心血管疾病的一个重要生理指标,定期测量血压可以帮助患者更好的控制血压,避免更严重的心血管并发症。传统的袖带式血压检测设备需要将袖带传感器牢固套在上臂,当需要持续监测血压时,会给受试者带来不适。研究表明,提取光电容积脉搏波(photoplethysmography,PPG)中与血压相关的信息可实现无袖带血压估计。但是采集的PPG信号容易受到干扰,难以准确提取特征。此外,人工提取的特征并不能
随着城市轨道交通的快速发展,自动驾驶技术应用于轨道交通的研究也逐渐增多。一方面,单一传感器由于其覆盖面单一、鲁棒性差等缺点,难以满足轨道交通自动驾驶中面对的复杂感知环境;另一方面,由于轨道交通所特有的轨道界限特征,准确判断出障碍物目标是否侵限轨道,对自动驾驶有轨电车安全行驶至关重要,而传统的利用相机识别轨道方法对环境、光照和天气依赖较大,且识别距离不能满足要求。本文根据现代有轨电车的应用场景搭建了
目标检测作为计算机视觉领域的重要任务,无论在学术界还是工业领域都备受关注,在现实生活中诸多方向上都应用了目标检测技术,如自动驾驶、智能监控和三维重建等。基于卷积神经网络的目标检测模型在检测任务上表现出优越的性能,然而网络层数和各种性能提升模块的堆叠,带来高准确性的同时也降低了检测速度,作为实时目标检测算法YOLOv3通过改进残差网络,在速度与精度上实现了较为完美的平衡。所以,基于YOLOv3对残差
城市绿地资源对支撑经济社会发展规模,维持良好生态系统发挥着越来越重要的作用,但城市绿地资源信息管理工作仍存在着资源分散,管理平台整合度低,业务协调度低,城市相关绿地信息资源共享不够等问题。本文通过收集研究区的绿地资源以及相关基础地理和环境资源数据,建立研究区基础地理与资源数据库,综合利用GIS技术和互联网开发技术,通过平台架构设计及关键技术的研究,基于WebGIS技术,采用“SOA”面向服务架构思
傅里叶叠层显微成像技术(Fourier ptychographic microscopy,FPM)是一种可以同时兼顾高分辨率和大视场的新型成像技术,它主要是由结构照明、叠层成像、相位恢复三大部分组成。在基于LED阵列照明作为光源的传统FPM系统中,通过依次点亮光源阵列中的LED,由于各位置LED对样品的照射角度不同,可以采集一组包含不同频域信息的低分辨率图像,这些图像随后通过相位恢复算法,在傅里叶
随着物联网(Internet of Things,Io T)以及边缘计算的发展,数据安全问题逐渐成为研究热点。由于Io T场景复杂多样且存在较多资源受限平台,传统的密码算法难以进行有效部署。针对已有的认证加密方案资源消耗大的问题,本文采用轻量级分组密码算法与伽罗华/计数器模式(Galois/Counter Mode,GCM)相结合的方案,实现了Io T场景下的轻量级认证加密引擎。本文在深入研究GC
当下网络技术不断创新,互联网行业自身发展趋于成熟,与各领域的关系愈发密切,互联网产品数量呈爆发式增长,导致产品同质化严重、用户流失、获客成本高昂等问题。用户使用APP过程中的决策行为,是APP用户的长期稳定使用产品的关键。聚焦APP用户不同决策场景与阶段的情感体验,以情感代入的方式来引导APP用户使用中的决策行为,维持良好的情感关系,形成稳定的使用习惯,是本文研究的重点。本文基于APP用户情感代入