基于多线性子空间分析的视频编码研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chenchenyaya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网视频数据的快速增长和相关新型应用的涌现,视频的高效压缩和传输成为学术界和产业界深入研究的热点问题。   本文提出了一种新的视频编码和传输框架,该框架应用多线性子空间技术对视频数据进行分析,所得到的子空间划分不仅有助于去除视频中包含的冗余相关性,更能进一步提取其中蕴含的语义信息,从而部分克服了传统编码方法中仅从像素级别进行压缩的不足。在该框架的基础上,本文还研究了张量空间的变换编码、基于视觉注意力模型的可伸缩视频编码以及非平衡差错保护和错误隐藏等问题。   当前视频编码方法大多单纯在像素级上去除冗余信息,难以在视觉对象级别对视频内容进行概括。本文提出了一种基于多线性子空间分析的视频编码机制。该机制采用广义主成分分析(Generalized Principal Component Analysis,GPCA)方法对视频帧进行多线性子空间划分,并将每个子空间近似地看作一组高度相关的视觉对象,在各子空间中分别进行变换编码。由于同一子空间内图像块之间在统计意义上相关度更高,因此基于GPCA的视频编码可达到更好的去相关目的。与此同时,同一子空间内的图像块在语义上彼此相关度较高,常常代表了同一组视觉对象,因此可有效用于后续的视频语义分析。   传统的变换编码技术只在水平和竖直两个一维方向上分别独立进行去相关变换,忽略了图像块之间存在的高阶相关性。作为理论上最优的酉变换,KL变换(Karhunen Leove Transform)方法不仪复杂度高,还必须把图像块转换成向量形式处理,忽略图像块之间的空间结构。针对这一问题,本文结合张量和矩阵代数等理论,提出了基于张量空间的KL变换方法。该方法的空间和时间复杂度比基于向量空间的KL变换大大降低,也取得了较好的视频压缩效果。   现有的可伸缩编码方法仅从时空分辨率和图像质量上来划分基本层和增强层,用户一般希望基本层尽可能多地包含其感兴趣的内容。本文在多线性子空间视频编码的基础上,提出基于视觉注意力模型的可伸缩编码,结合语义来划分基本层与增强层,使得基本层信息更能满足用户的需求。   编码后视频在传输过程中通常会由于各种原因出现数据包丢失或误码的情况,在差错保护和错误隐藏中结合编码阶段所获取的语义信息,本文提出了基于多线性子空间分析的非平衡差错保护和错误隐藏方法,在网络状况恶劣的条件下有效地提高了网络视频的播放质量。
其他文献
随着信息科技的快速发展,人类的生活发生了翻天覆地的变化。通过智能科学在生活中的普遍应用,人们可以随时享受智能科学带来的方便和快捷。在智能科学中,最具有代表性的就是机器
H.264是一种高性能的视频编码方法,但其在运动估计、帧内预测、插值、变换和算术编码等方面具有很高的计算复杂度。根据其内在的并行度,通过分析并行化的瓶颈所在,合理地设计
团分划问题的目标为将给定图分划为给定大小的完全图集合。在计算生物学的聚类分析等中有着广泛的实际应用场合,团分划问题属于NP-完全问题,因此除非P=NP成立,我们很难找出一个
SIP(Session Initial Protocol)是伴随着互联网的发展而诞生和发展的,并以其简单易用以及良好的扩展性和开放性等优势,已发展成为下一互联网至关重要的应用协议。SIP本身缺乏
周期行为分析方法是通过比较程序不同程序段的特征信息分析程序相似性的方法。由于划分到同一周期行为的程序片段具有相似性能特性和资源需求,因此,周期行为分析已广泛应用于
商业智能工具迅速发展,多维查询技术日趋成熟,在线联机分析系统查询效率的提升成为急需解决的问题。聚集技术是提升在线联机分析系统性能的关键技术之一。在分析达梦聚集技术
多种生物克隆实验结果说明,存在于细胞核染色体中的DNA序列包含了该生命体的全部信息。生物序列进行序列比对后,所得结果包含了序列之间的关系和进化的信息,利用这些信息可以得
随着计算机时代的迅猛发展,分析网络的安全性相当重要。保证安全协议的安全性及秘密性已是网络安全领域的最热门话题之一。安全协议自身的缺陷给网络安全造成了巨大的威胁,为
随着3G时代的到来,高端手机的普及,以及中国移动条码增值业务的推动,基于手机端的二维条码识读技术已成为当今条码识读技术的一个热点研究方向。一种高效、快速、健壮的手机条码
多分类器集成,也称多分器组合或多分类器联合,近年来,多分类器融合技术在人脸识别、手写字符识别、遥感图像分类等方向上受到了广泛重视,显示出很大的研究价值和现实应用前景