基于混合深度线索和样本学习的3D电视立体内容自动生成

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bjbysj44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,3D电影开始吸引消费者和电影制作公司的关注,通过立体摄像机制作了越来越多的3D视频。然而,大多数的视频依旧以2D的格式存在,在后处理阶段把这些2D视频转换成3D格式往往需要深度图像估计。在本文中,通过对深度线索和机器学习方法的深入研究,讨论了基于多深度线索融合和基于样本学习的深度图像估计方法,并分析了各自对应的优缺点。通过自适应多深度线索融合的方式提出了一个改进的深度图像估计算法,并且在基于样本学习的方法中考虑到局部连接信息,利用现代图形处理单元(Graphics Processing Unit, GPU)的加速技术来实现快速的2D视频立体化。本文深入讨论了3D立体视频生成过程中的深度图像估计算法,主要从以下几个方面开展了工作:(1)分析了视频立体化的原理,讨论了几种深度图像估计方法,介绍了基于GPU的加速技术。(2)提出了一个基于多深度线索融合的深度图像估计方法,基于运动信息提取前景深度,利用相对高度线索估计背景深度。利用局部运动的自适应修复,对原方法进行改进。实验结果证明,改进的方法可以提高深度图像的质量,并能够保持深度的帧间一致性。(3)提出了一个基于学习的视频立体化方法,兼顾全局和局部的图像信息。对于视频的关键帧,根据结构相似的图像具有相似深度的假设,从RGB-D数据库中使用样本学习得到全局的深度信息,并以最小生成树原理表示的局部连接信息来修复深度图像。利用运动补偿和深度传播的方法来估计非关键帧的深度图像。实验结果显示,相对于传统的基于深度线索的深度估计方法,本方法更加准确高效。(4)通过GPU加速技术,提出了一个快速的基于学习的视频立体化方法。根据2D视频立体化过程中各个模块的时间花费,利用GPU的高效性能,对其中时间花费较长且满足并行化的模块进行GPU加速,并利用显著图对深度图像做进一步的修复。在AMD Athlon II X46312.6GHz和英伟达GT630的编程环境下,实验结果表明,GPU对可并行化的图像处理具有良好的加速效果,使用GPU加速的模块比使用CPU至少快5~10倍。
其他文献
在视觉监视领域日益追求自动化的今天,设计一种能完全替代监控人员、自动对监视场景中运动目标(诸如人,汽车)进行实时、持续的主动监视的高智能化监控系统就显得非常迫切。这种
机动目标跟踪是军事领域中精确打击和民用领域中空中交通管制的前提条件,而转弯角速度辨识是实现机动目标精确跟踪的关键。由于转弯角速度的非线性耦合特性,传统方法只能实现近
近年来,3D立体视图作为新的媒介越来越受到关注,于此同时3D立体视图的视觉舒适度越来越重要,针对3D立体视觉舒适的研究越来越多。通常来说,立体图像中的视觉不舒适是由图像本
现场总线控制系统是指应用在生产现场,在微机化测量控制设备之间实现双向串行多节点数字通信的系统,也被称为开放式,数字化,多节点通信的底层控制网络,它导致了传统控制系统
上世纪中叶以来,微电子、计算机、通讯、网络、信息、自动化等科学技术的迅猛发展,掀起了以信息技术为核心的“第三次浪潮”,正牵引着人类进入工业经济时代最鼎盛的时期,并打
磁共振弥散张量图像处理与分析涉及多学科领域,包括数学、物理学、医学及计算机图像处理等多学科知识,是多个学科在医学领域内的交叉.该文的研究重点是磁共振弥散张量图像处
微型计算机断层成像(Micro-Computed Tomography,Micro-CT)是一种具有高分辨率且无损伤的三维成像技术,可以在不破坏实验样本的情况下获得用户想要的样本内部信息,Micro-CT设备还
模型预测控制(Model Predictive Control,简称MPC)是在20世纪70年代后期产生的一类新型计算机控制算法。MPC通过在有限的时域里最小化目标函数来计算将来的控制行为,集模型预测
随着Internet的迅速发展,Internet上的信息成指数增长。由于网络信息资源的飞速增加,给人们在网上寻找所需信息带来了很大的困难。搜索引擎的出现增强了人们收集和定位所需信息
钢结构相对传统建筑形式具有诸多优点,被称为绿色建筑的主要代表,是未来建筑的发展趋势。随着国家经济的发展和科技的进步,钢结构在我国应用范围也不断扩大,市场竞争愈发激烈,产品正朝多样化的方向发展,对钢结构制造企业提出了更高的要求,但是由于钢结构生产工艺复杂,生产约束条件众多且彼此相互关联,生产计划与调度方案难以寻求最优解,经常出现订单交货期延误等问题。合理的生产计划与高效的生产调度,成为钢结构企业亟待