基于视差估计的多视点视频编码研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:leng159461
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视点视频(Multi-view Video)是能够提供立体感和交互操作功能的新型视频系统,它能够提供场景对象在不同观察角度下的视频图像信息,并可根据使用者的需求自由选择和操作视听对象。具有立体感和交互操作功能的多视点视频是现代视频技术的新兴研究方向,将成为未来视频技术的重要组成部分。但是,多视点视频和单通道视频相比,数据量成倍增加,必须采用更高效的编码压缩算法,才能对多视点视频数据进行存储和传输。在多视点视频中,除了各个视频流内具有很强的空间和时间相关性,各视点之间也具有一定的交叉相关性,如何有效地利用这些相关性是提高多视点视频编码效率的关键。为提高多视点视频的压缩效率,本文主要在多视点视频编码的运动与视差矢量预测、视差预测结构以及与分级B帧相结合的编码方案等方面进行了研究。   本文首先分析了基于H.264标准的数字视频编码算法,重点研究了运动补偿和运动估计的算法实现和改进原理,在此基础上,结合运动估计的中心偏置特性,提出一种运动矢量场自适应搜索算法,使运动估计匹配准确率和搜索速度得到有效提高。在深入研究运动估计算法的基础上,本文分析了运动估计和视差估计的数据特性和算法特点,论述了运动估计和视差估计在算法思想上的相似性与差异性,探讨了利用多视点数据流的空域相关性与时域相关性进一步压缩数据的改进途径,提出了一种基于视差矢量特性的快速视差估计算法,充分利用了空间数据信息的相似性,有效消除了空域数据冗余。   本文系统地研究了多视点视频系统的实现原理,考察了现有的典型多视点视频系统框架,分析了多视点视频系统的实现原理,研究了目前主流的多视点视频编码实现方法,在视差估计编码思想的基础上,深入分析了分级B帧的预测结构和编码优势,探讨了将分级B帧引入多视点视频编码方案的改进空间,并提出结合分级B帧的多视点视频编码方案,经实验验证,达到了提高多视点视频压缩效率的目的。
其他文献
视觉目标跟踪技术在智能监控系统、增强现实、模式识别和机器学习等领域有着广泛的应用,成为了计算机视觉领域研究热点之一。行人跟踪是视觉目标跟踪技术的核心研究内容,但由于
随着互联网的普及和网络用户的不断增加,互联网中 Web服务的种类与数目也随之产生了爆炸式地增加。现有的 Web服务领域还存在如下问题:一是如何在海量的服务中找到满足请求的服
随着大数据时代的来临,数据以数据流的形式快速产生,多标签数据流应用亦更加普遍。例如:电子邮件分类、新闻推送、医学诊断、图像识别等。由于多标签数据流具有速度快、数据
人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,它在公共安全、信息安全、人机交互等领域中有着广泛的应用前景。经过三十多年的研究,人脸识别技术在理想环境
网上购物已经成为越来越普及的新的购物习惯。网络购物的主要好处包括:送货上门、比较方便;价格便宜;购买到本地没有的商品;节省体力和时间;商品品种较多;比传统购物的效率高等。近
集成了传感器、嵌入式计算、网络和无线通讯技术而成的无线传感器网络是一种全新的信息获取和处理技术,无线传感器网络可以自组织网络拓扑结构,节点间通过协同工作能够实时监
近年来,各种新型的保险业务不断涌现,人们对保险业务的要求也不断提升。如何根据投保品种、投保人等历史数据,合理设定储备金数额、保险金标准,进行快速有效的风险分析和损益判断
随着新一轮教师全员培训的全面推进,教师继续教育的管理工作也变得越来越复杂和繁重,传统的教师继续教育信息管理方式与手段已经不能再适应形势的需要。利用现有的信息技术整合
近年来,智能交通系统(ITS)、车载GPS定位系统、城市交通诱导系统等相关地理信息系统(GIS)技术的广泛应用对电子地图搜索服务提出了更高的要求。因此,对电子地图搜索及其相关
在现代远程教育的迅速发展的过程中,由于经历了网站构建技术的不同时期,很多教育网站的实现技术、构筑平台及系统架构都相差甚远。本文研究的重点是如何实现尽可能地保留已有的