基于RGB-D特征和ROI的三维视频压缩方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：tanglang1

【摘要】

：

智能播放终端、消费级RGB-D传感器以及移动通信的发展,为三维(3D)视频从大荧幕迈向更广泛的应用带来新的契机。多纹理多深度(MVD)视频,因其能提供灵活的深度感和支持任意角度

【作者】

：

提纯利

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

三维视频压缩 ROI压缩 3D-HEVC RGB-D特征分析深度图重建

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

智能播放终端、消费级RGB-D传感器以及移动通信的发展,为三维(3D)视频从大荧幕迈向更广泛的应用带来新的契机。多纹理多深度(MVD)视频,因其能提供灵活的深度感和支持任意角度的虚拟视点重建,被认为是目前支撑增强现实、虚拟现实、自由视点电视等需求的最为有效的3D视频格式。但同时传输多路纹理视频和深度图序列所需巨大数据量也给MVD视频的实际应用带来挑战。这需要利用更高性能的压缩方法抑制MVD视频内冗余,以在保证质量的条件下尽量提升压缩比。H.265/HEVC编码框架利用更复杂的预测和熵编码模式加强了对空间冗余、时间冗余和统计冗余的抑制;3D-HEVC通过引入路间预测进一步抑制了视点间以及纹理视频与深度图间冗余。然而如何更有效地利用人类视觉系统(HVS)的特点抑制视觉冗余仍亟待解决。本文利用HVS对感兴趣区域(ROI)内质量更为敏感,其他区域存在更多视觉冗余的特点,围绕3D视频的ROI压缩展开研究。ROI的自动准确选取是保证ROI压缩性能的前提,本文首先研究了HVS显著度与视频深度和纹理特征间的联系,然后从RGB-D特征分析的角度,研究了3D视频ROI自动选取方法。接着,针对视频压缩技术对后向兼容性的需求,研究了现有编码标准中控制压缩性能的率失真优化功能,并据此研究了面向3D-HEVC并具有良好兼容性的ROI多分辨和ROI多量化参数(QP)压缩方法。最后,分析了深度图的特点及其对立体感的作用,针对现有RGB-D传感器的常见退化和HVS对轮廓区域深度认知特性,研究了基于轮廓引导的的深度图ROI重建方法。本文的研究对于利用HVS生理和心理特性,在现有传输条件下,提供更高质量的视频和更灵活的信道适应性,满足未来应用需求具有重要意义。首先,为了实现3D视频ROI自动选取,论文通过全面分析HVS关注度与视频不同特征间的联系,提出了基于RGB-D视频特征分析的ROI选取方法。论文先建立RGB-D四元数表达系统,其能够以数制形式融合地表达颜色与深度信息,为彩色图像特征分析算法推广到RGB-D领域提供了简洁通用的框架。在此基础上,考虑到轮廓区域对立体视觉的重要性,提出基于全四元数梯度滤波的语义轮廓检测方法,实验证明该方法能在准确提取语义轮廓的同时抑制阴影等物体内部纹理,为ROI选取和后续深度图ROI重建提供重要支撑。接着,研究了HVS心理和生理显著度与视频深度、纹理、面部分布以及场景相对位置的关系,提出基于四元数meanshift分割、纹理显著度检测、三维人脸检测和位置加权的显著图生成方法,并与轮廓区域结合完成ROI选取。对多个MVD测试序列的实验证明,本文算法的ROI选取结果能综合体现以上视觉关注特性。其次,针对现有压缩标准中全局率失真优化的比特率分配与HVS特性不符的问题,提出了基于ROI预处理与3D-HEVC兼容的ROI多分辨和ROI多QP压缩方法,进一步抑制n ROI内视觉冗余。论文研究了3D-HEVC中率失真优化在编码模式选择和码率分配中的作用,通过实验验证了其ROI内产生了更大的失真,而其他区域内细节得到了更好的保护。出于兼容性考虑,提出基于ROI多分辨预处理和ROI多QP预处理的压缩方法,通过主动抑制非ROI内细节信息,利用率失真优化准则,使编码器认为在该区域使用更节省比特率的编码方式即可达到较低的失真度,从而使更多的比特率分配到ROI,保护ROI内细节的同时抑制其他区域视觉冗余。实验证明,与3D-HEVC压缩结果相比,本文提出的ROI多分辨和多QP压缩方法都能够在保证视频主观质量条件下,使视频的整体比特率明显降低。通过不同测试序列的实验,本文ROI压缩方法与3D-HEVC压缩传输系统能够良好兼容,并提高其质量选择灵活性和对网络条件的适应性。最后,考虑到深度图轮廓区域对重建视频质量和立体感的重要影响,以及针对目前消费级RGB-D传感器普遍存在的深度退化,提出了基于自适应形态学的深度图重建算法,利用深度图特点及其与高质量纹理视频间的空间相关性对传感器的固有深度退化以及压缩引入的深度降质进行重建。论文先分析了深度图和数学形态学滤波的特点,通过统计实验验证了形态学滤波对深度图重建的适用性。之后,分析了场景语义轮廓与HVS立体感知间的关系,为了保护物体形状特征提高重建准确度,提出基于RGB-D语义轮廓约束的形状自适应结构元素(SASE)生成方法,并利用SASE实现了深度图高效重建。为进一步保护深度图平滑区域的三维形态特征,解决传统形态学算子产生灰度漂移的问题,论文提出了广义数学形态学滤波的概念,将数学形态学从摄像机坐标系推广到任意笛卡尔、柱面和球面坐标系。据此,提出一种形状-模式自适应形态学滤波算法,用于在不追求实时性的应用场景中进一步提高深度图重建的精度。通过定量模拟实验和真实传感器数据实验证明,本文提出的形状自适应形态学滤波方法能够在播放端对深度图进行实时重建,相比其他先进深度图重建算法获得更好的重建精度,尤其能保护轮廓附近的深度信息的准确性。形状-模式自适应形态学滤波方法能以更高的计算复杂度为代价进一步保护深度图中三维空间结构。

其他文献

如有异见不如一见华为荣耀V8智能手机

<正>荣耀V8吸取了华为自家Mate、P系列等前辈的诸多优点,集更精致的金属机身、性能强大的麒麟950系列处理器和双摄像头于一身,在中端价位上掀起了新一轮的超值风暴。在荣耀家

期刊

智能手机双摄像头华为荣耀

维生素B12治疗4例顽固性褥疮的初步观察

<正> 褥疮是瘫痪病人常见并发症,比较难治,我们用高浓度维生素B12治疗,效果较好,现报告如下。病例选择:4例均为男性,3例为截瘫病人,1例偏瘫。4例病人在当地均曾使用多种药物

期刊

维生素顽固性初步观察

促进东北地区冰雪旅游品牌资源可持续发展的策略研究

运用文献资料法、实地考察法、专家访谈法、对比分析法等研究方法对发展冰雪旅游品牌资源促进东北三省经济增长的战略进行研究,通过分析东北地区冰雪旅游品牌建设的现状,了解

期刊

冰雪旅游东北地区体育产业品牌策略

浅谈小学数学课堂思维训练

<正>《数学课程标准》中,关于"解决问题"的总目标中明确要求:形成解决问题的一些基本策略,体验解决问题策略的多样性,发展实践能力与创新精神。因此,我们可以说,解决问题策略

期刊

思维训练小学数学课堂

黄土高原不同乔木林土壤微生物量碳氮和溶解性碳氮的特征

选取黄土丘陵区子午岭4种不同乔木林下的0—5 cm和5—20 cm的土壤为研究对象,通过氯仿熏蒸浸提方法测定了微生物量碳氮、溶解性碳氮以及土壤的理化性质。研究结果表明,不同乔

期刊

子午岭不同乔木林微生物碳氮溶解性碳氮

小学高年段学生设计思维能力现状及科学教育应对的研究

近年来,设计思维受到国内外学者的广泛关注,技术极速迭代时代需要设计思维人才,此外,小学生对设计有天然的兴趣和天赋,小学科学课程与设计思维有密不可分的关系,因此将设计思维引入到小学科学教育领域,具有重要的意义。针对上述情况,结合笔者对国内外文献进行大量阅读和分析理解的基础上,研究主要围绕以下问题展开:①小学高年段学生设计思维能力的现状如何?②培养设计思维的科学教育应对策略是什么?经过不断地研究和分析

学位

小学高年段学生设计思维科学教育应对策略

纳米结构钴基和钼基高效电催化剂构建及其水分解行为研究

随着传统能源的快速消耗,由此带来的能源危机和环境恶化问题引起人们的广泛关注,开发新型清洁能源势在必行。电催化能源转化技术具有操作简单,能量转化效率高等优点是清洁能

学位

析氢反应析氧反应非贵金属催化剂电催化纳米刷

王者荣耀背后的电竞江湖

<正>在这个炎热的夏季,现象级电竞游戏王者荣耀因被指责"毒害未成年人"而成为最热门的社会话题之一,遭受了来自各方的道德拷问。在这款被玩家戏称为"王者农药"(形容一旦投入

期刊

王者荣耀职业联赛《中国经济周刊》电子竞技游戏直播平台

PICC穿刺部位渗液的原因分析及护理效果分析

目的探析PICC穿刺部位渗液的原因及护理效果。方法选取2016年2月~2017年5月在我院行PICC穿刺的患者120例作为研究对象,找出穿刺部位渗液的原因,总结临床护理对策。结果 120例

期刊

PICC穿刺部位渗液原因护理对策

腾讯手游《王者荣耀》成功的秘诀

<正>谈起当今中国的电子游戏市场,首先想到的就是《王者荣耀》。这款在2015年年底才刚刚开始公测的游戏,在短短8个月内就为腾讯的财务报表增添了一笔高达13亿的营业额,一年之

期刊

人物设定《王者荣耀》二次创作

基于RGB-D特征和ROI的三维视频压缩方法研究

与本文相关的学术论文