深度视频信号预处理及其在编码中的应用研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:hnzxjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视点视频能够让观众体验到震撼逼真的立体感,应用前景非常广阔。多视点视频系统采用基于MVD(Multi-view video plus depth)的3D场景表示形式,与单视点视频系统相比,传输需要占用的带宽和数据量成倍增加。MVD视频信号中相同视点的深度视频与对应的彩色视频相比较,纹理更少,更加平坦。在相同编码的条件下,深度视频平均只占彩色视频序列20%左右的码率。利用基于深度的虚拟视点绘制方法可以由少数的几个视点绘制得到多个视点,大大降低MVD编码传输的数据量。但是,受现有的深度视频获取技术的局限,目前得到的深度视频并不准确,其时域和空域相关性较弱,对编码效率有很大的影响。深度视频的不准确性还会导致在虚拟视点绘制的过程中空洞的出现,进而影响虚拟视点的质量。本文开展深度视频预处理及其在编码中的应用研究,拟提高编码码率、编码速度和虚拟视点的绘制质量,主要包含以下三个部分。(1)深度视频预处理算法设计的空域滤波器常采用的是规则的矩形窗口,那么同一窗口内可能会覆盖不同的对象,这样滤波后会导致深度视频存在一定程度的失真,最终影响虚拟视点的绘制质量。本文提出了一种深度视频空域预处理方法,其中滤波窗口的大小和形状可以自适应改变。首先,提取深度视频中的边界区域、不连续区域、前景和背景区域。然后,采用高斯滤波器对不连续区域进行滤波,采用基于自适应窗口的空域滤波器对连续区域的前景区域和连续区域的背景区域分别进行处理,其中各个区域中属于边界区域的像素跳过不处理。实验结果表明,提出的方法能够平均提高绘制得到的虚拟视点的PSNR达0.21dB,同时节省8.33%-34.39%的码率。(2)现行主流的多视点视频编码结构大部分都包含了B帧和P帧,编码效率的贡献主要在于时域上的挖掘。因此,仅仅从空域上对深度视频处理是不够的。本文提出了一种深度视频时空域联合增强算法。首先,分析了深度失真与虚拟视点绘制质量关系,结合人类视觉系统特性,得出JNDD(Just noticeable depthdistortion)模型。然后,对深度视频进行基于JNDD的时空域增强。实验结果表明,提出的方法能够节省11.28%-46.70%的编码码率。绘制得到的虚拟视点的主观质量和客观质量都没有明显的变化。(3)深度视频快速编码对于3D视频实时传输意义重大。传统的快速编码方法由于不可避免的存在误匹配,编码码率一般会基本不变或者在一定范围内增加,且虚拟视点的绘制质量难以提高,结合预处理的深度视频快速编码算法可以弥补传统快速编码的弊端。本文提出一种联合预处理的深度视频快速编码方法。首先对深度视频进行预处理增强时空相关性,然后根据各个区域宏块模式分布规律特性,设计不同的宏块模式选择策略来提高编码速度。实验结果表明,提出的方法可以使深度视频编码时间节省88.21%-90.68%,码率节省0.24%-36.02%,虚拟视点绘制质量基本不变。
其他文献
EPON以光纤到家(FTTH)和光纤到楼(FTTB)为目标,具有经济性好、带宽高、覆盖范围广等优点,成为目前最具有竞争力的用户接入网解决方案。但日臻完善的EPON距离实用化和大规模普及
本课题是江苏省高技术研究计划“宽带短距离无线接入技术研究”(BG2005001)研究内容之一。论文提出了一种基于蓝牙和GPS技术的车辆管控系统总体方案,分析了其中的关键技术,详细
雷达面临着越来越强的低空/超低空突防、反辐射导弹、综合电子干扰和隐身技术等四大威胁,这就对雷达的抗干扰能力和生存能力提出了愈来愈高的要求。许多新一代雷达都采用了数
随着物联网的发展,无线传感网络各项技术的逐渐成熟,大规模、高密度的网络布局成为无线传感网络的发展趋势。相对于传统的单汇聚节点无线传感网络,多汇聚节点的设计在数据传输可
21世纪的人类社会是信息化社会,数字化后的信息,尤其是数字化后的视频和音频信息具有数据海量性,它给信息的存储和传输造成较大的困难,成为阻碍人类有效地获取和使用信息的瓶颈问
随着信息技术的发展和日益增长的安全的需要,基于生物特征身份识别技术近年来有了迅速的发展。在现有各类生物识别技术中,虹膜识别是相对较新并且具有巨大潜力的技术。 本文
伴随着计算机技术、网络通信技术、视频压缩以及多媒体技术的飞速发展,视频监控系统已逐渐成为各行各业安全防范工作中最主要的技防手段。概括来讲,视频监控系统的发展经历了三