HEVC视频编解码及视频分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lizhiguo518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高清和超高清视频的不断涌现,H.264/AVC已不能满足人们对于更高的编码效率的需求,国际视频编码组织VCEG与MPEG联合成立JCT-VC工作组来制定新一代视频压缩标准HEVC(High Efficiency Video Coding),并于2013年完成了该标准的制定工作。与H.264/AVC相比,HEVC仍采用传统的混合视频编码框架,但其对各个模块的技术都进行了一定的创新,包括灵活块划分方式、更加精细的帧内预测和基于竞争的运动矢量预测等,这些新的技术使得HEVC的编码效率提高了50%左右。然而,这些新的技术也大大增加了编码器的编码时间,阻碍了标准的应用与推广。因此,研究快速、高效的编码优化算法至关重要。同时,作为视频标准技术的一个重要应用,监控视频越来越受到大家的关注,对监控视频进行视频分析也逐渐成为研究热点,如何快速有效的进行监控视频中运动物体的检测和分类是建立智能监控系统的基础。  本研究主要内容包括:⑴根据Advanced Motion Vector Prediction(AMVP)中候选的空域和时域运动矢量的重要性的不同,提出了运动矢量列表构建过程的简化方案。在HEVC编码标准的多视点扩展层中,HEVC采纳了预测单元级的运动信息继承(Motion Parameter Inheritance,MPI)来提高深度图中运动矢量的预测,通过分析发现,MPI模式的主要增益来自PU中的2Nx2N模式,因此本文提出将MPI模式从预测单元级调整到编码单元级来减少编码该模式所需要的头信息。实验结果验证了这两项技术的有效性,其中AMVP技术的简化方案已被HEVC标准所采纳。⑵通过分析发现,是否使用变换的预测残差的能量分布是不同的,因此,针对变换跳过模式下编码块中预测残差的能量分布,设计了一套新的系数扫描方案。对于色度分量,由于最大的编码单元和变换单元尺寸的不同,HEVC使用两种不同的方式对变换单元的编码块标志(CodedBlock Flag,CBF)进行编码。为了简化色度分量CBF编码的过程,本文提出了统一的CBF编码方法。实验结果验证了两种改进算法的有效性,其中统一的CBF的编码方法已被HEVC编码标准所采纳。⑶提出了一个快速帧内编码算法,该算法包括以下四个技术。首先,利用当前编码单元与其周围编码单元之间的相关性,减少需要穷举的块划分结构的范围,从而加速块划分选择的过程。其次,为了降低帧内预测方向选择过程所需时间,本文根据粗选择过程中各个候选的预测方向最终被选为当前块的最优预测方向的概率的不同,进一步减少进入率失真决策的帧内预测方向的个数;同时,考虑到图像之间的相关性,把当前块的最有可能预测方向也加入到率失真决策的集合中。再次,本文对不同的预测单元中使用的变换单元大小的概率进行统计和分析,提出了快速的变换单元深度选择算法。最后,根据模式信息对采用变换跳过模式进行编码的4x4块进行分类,提出了快速的变换跳过模式的决策算法。实验结果表明,本文提出的快速帧内模式决策算法在全 I帧的配置条件下能节省大约50%的编码时间,同时仅仅带来0.5%左右的 BD-rate的下降。该算法的第二部分和第四部分已经被采纳到HEVC的参考软件中,并且被广泛引用。⑷对于每个4x4的块进行特征的提取,并根据这些特征训练出一个分类器,来判断其是前景还是背景,根据连通图标记算法形成前景区域。对于每一个前景区域,使用基于词袋(Bag of Words)的方法来训练第二个分类器,并进行运动的人和车的识别。结果表明,提出的算法具有很好的效果,并且对于检测和分类具有很好的鲁棒性。
其他文献
模式识别又常称作模式分类,是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释,也是信息科学和
科学基金制在国际上已被广泛用作国家科技资源分配和管理的主要手段。相较于美国等发达国家,我国的基金数据管理信息化建设比较晚。随着科学基金数据的不断增多,信息化管理要
遗传算法(Genetic Algorithm,简称GA)由John Holland于1975年提出,对于传统方法难于求解的组合优化、模式识别、图像处理等复杂问题,使用该算法求解能得到令人较为满意的解。
人脸识别技术是一种依据人的面部特征来自动进行身份鉴别的生物特征识别技术。由于人脸识别技术在生物特征识别技术中具有众多的优势(特别是直观、非侵犯),决定了其广泛的应
21世纪是网络时代,人们的工作、学习和生活都与网络息息相关。但网络在给世人提供方便快捷的服务同时,也埋下了很多社会道德、法制、政治隐患,究其来源,就是网络中不良信息的
传统软件开发中固有的复杂性、软件产品的不易重复性,严重制约了软件产品的生产。如何提高软件产品的复用性,缩短软件开发的周期,降低软件产品的维护成本,成为软件业普遍关注的问
随着Internet和移动通信的迅速发展,人们对移动性和信息的需求也在急剧上升。越来越多的人希望在移动的过程中能持续方便地访问互联网,不更改计算机配置就能获取信息和高质量
目前,关系到国家安全和国计民生的重要行业,如金融、电信、能源、民航等的高性能容错计算机基本由国外厂商垄断。自主开发高性能容错计算机在保障我国的信息安全、提高我国产
虹膜识别作为重要的生物特征识别,因其具有唯一性、稳定性、可采集性、非侵犯性等优点而引起了广泛的关注,并且取得了相应的成果。然而在识别速度和准确率方面,很难做到两全
伴随着现代网络技术、通信技术、计算机技术的日趋成熟以及信息化普及程度的不断提高,智能化家电产品、个人计算机以及移动终端设备在家庭中的普遍应用,数字家庭市场已经形成并