面向无线视频的预测编码技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:zd013wyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测编码技术通过空间域的信号预测以及时间域的运动预测补偿,消除视频图像的空间和时间相关性信息冗余,从而减少视频信号表示需要的数据量,是数字视频压缩编码的关键部分,对视频数据压缩效率及视频图像质量有深刻影响。无线视频通信应用的蓬勃发展对视频压缩编码技术特别是预测编码技术不断提出新的挑战,主要表现在:为降低对昂贵的无线网络带宽的需求,视频编码中采用了更先进、计算复杂度更高的预测编码技术以提高压缩效率,然而无线设备计算能力的不足对于预测编码算法的实时实现是一个巨大挑战;无线计算环境下计算能力的不确定性对视频编码器的自适应能力提出了更高的要求,使得预测编码技术面临计算能力变化条件下保证实时实现并维持视频质量的挑战。因此,快速高效、具有计算环境自适应能力的预测编码技术是面向无线视频应用视频编码技术的研究重点和研究热点。本文基于当前流行的预测编码结构,重点研究了计算复杂度占主导地位的运动估计算法,从减少块匹配的次数及降低块匹配计算的复杂度两方面研究了块匹配运动估计的快速算法,并针对多参考帧运动预测技术带来的计算复杂度线性增长,研究了加速多参考帧运动估计的方法;针对多种预测模式带来的高计算复杂度,研究了加速预测模式选择的方法。另外,针对无线设备计算能力不断变化的特征,本文还研究了使运动预测具有计算复杂度可伸缩性的方法。取得的主要研究成果如下:1.深入研究了通过减少块匹配的次数加速运动估计进程的策略,提出一种基于方向性平行四边形搜索模式的快速运动估计算法。设计了具有方向性的平行四边形搜索模式,根据预测运动矢量的位置信息判断运动的趋势,使得方向性的搜索模式与运动趋势相适应,避免了运动搜索的盲目性;采用搜索模式方向上下文自适应的搜索策略,根据当前最优点与次优点的位置关系决定搜索前进的方向、搜索模式的方向以及搜索点的选择,使得运动搜索路径与失真递减的方向一致,提高了运动搜索的效率;另外,还设计了一种预测加速度运动矢量的运动矢量预测因子,增强了运动矢量预测的性能。实验结果表明,提出的快速运动估计算法比现有的方法具有更高的计算加速性能和率失真性能。2.深入研究了通过降低块匹配计算的复杂度加速运动估计进程的方法,提出一种基于起始搜索中心点预测的部分失真搜索快速运动估计算法。以规格化部分失真搜索算法为基础,通过对起始搜索中心点进行有效的预测,加速部分失真搜索的收敛过程;在搜索过程中引入提前结束检测机制,在起始搜索中心点预测阶段判断提前结束条件,避免了不必要的后续搜索匹配计算;根据搜索路径的特点以及不同搜索路径的失真差,设计了一种中途终止检测机制,在当前路径搜索结束后及时判断后续路径搜索的必要性,进一步减少了搜索点冗余。实验结果表明,算法在保证较高视频质量的同时,比同类型其它算法具有更高的计算加速性能;如果将提出的算法和基于方向性平行四边形搜索模式的快速算法结合使用,则能进一步提高运动估计的执行速度。3.针对多参考帧运动预测技术带来的计算复杂度线性增长问题,提出一种基于小钻石区域选择的快速多参考帧运动估计算法。根据多参考帧运动估计的特点,设计了多参考帧条件下的运动矢量预测机制,改善了远距离参考帧的运动预测精度;分析了多参考帧条件下运动矢量的空间与时间分布特征,以此为基础设计了基于小钻石路径搜索的参考帧选择方法,它在最近参考帧之外的其余参考帧中选择最佳的候选参考帧;提出的算法只需在两个候选参考帧中执行完整的运动估计,且参考帧选择的准确性保证了最终的运动预测性能几乎不受影响。实验结果表明,提出的算法能够显著降低多参考帧运动估计的计算复杂度,同时保持了多参考运动估计的高率失真性能。4.针对多种预测模式带来的高计算复杂度问题,提出一种层次性预测模式选择框架以及基于此框架的快速预测模式选择算法。层次性框架根据各种预测模式所代表的空间和时间特征对宏块进行层次性分类,根据当前宏块提取的特征参数在不同层次上选择合适的预测模式类型;快速预测模式选择算法以层次性框架为基础,在复杂的率失真模式选择之前,在不同的层次提取特定的特征参数,根据特征参数值选择模式类型,选择的模式类型确定了需要考察的预测模式,而未选择类型包含的模式则不需要进行率失真代价的计算。实验结果表明,提出的快速预测模式选择算法能够有效减少使用的预测模式个数,显著降低多预测模式率失真选择计算带来的高计算复杂度,同时视频编码的率失真性能损失很少。5.针对无线设备计算能力不断变化的特点,提出一种基于层次性计算能力分配的运动预测算法计算复杂度可伸缩机制。根据运动估计按照宏块光栅扫描顺序执行的特点,在帧级计算能力约束条件下,为运动预测设计了包括初始分配、全局分配及部分分配的三层计算能力分配策略,综合利用已完成帧的信息以及当前帧执行的中间结果将计算能力有效分配到每个宏块;使用了可扩展的运动估计搜索模式,使得分配的计算能力出现冗余的情况下能够被充分利用,以进一步提高预测精度。实验结果表明,提出的可伸缩机制能够实现预测算法的精细粒度计算复杂度可伸缩性,同时保证了计算能力约束下尽可能高的总体预测精度及图像质量。综合应用前面的研究成果,本文设计了一个视频编码器软件实现的原型系统。原型系统以H.264参考软件为基础,对其代码结构与数据结构进行了适当优化,同时集成了本文提出的算法。实验结果表明,原型系统能够获得较好的编码加速效果和率失真性能,进一步验证了本文所提出算法的实际使用性能。
其他文献
中国能源建设集团科技发展有限公司(简称“能建科技”)自成立伊始就肩负着中国能建产业转型升级的使命。他们抓住海外建设工程后期运营市场空白的机遇,向着延伸产业链条、建设运营一体化、深入推进属地化经营模式的目标迈进。  国际市场大有可为  能建科技打造国际型能源服务商,与以往的能源建设公司最大不同之处在于服务为先。中国能建是传统的能源建设企业,侧重于EPC工程总承包。对于发电设施建设完成后的后端市场涉猎
传统的端口号与深度包检测分类技术已不能满足网络中各类应用的分类要求,无法进行准确分类。为此,提出一种基于半监督学习的马尔科夫模型网络流量分类算法。利用流之间的相关
目的观察不同月龄小鼠骨髓源性内皮祖细胞(endothelial progenitor cells,EPCs)数量和部分生物学功能以及外周血抗衰老蛋白klotho(K1)表达水平,探讨Kl对体外培养的老龄小鼠EPCs数量
2月17日,国务院国资委主任肖亚庆会见了荷兰托克集团CEO杰里米·威尔一行.肖亚庆就全球经济形势、大宗商品价格走势、中国能源矿产等市场发展态势等问题与杰里米·威
<正> 仔猪白痢是我地区仔猪的多发病,临床上以下痢、排出乳白色或灰白色、粘稠的、并有特异臭气味的糊状粪便为特征。多见于生后30日龄内的仔猪,从1979年以来,我们用泥胡菜注
目的通过这次试验观察肾康注射液联合前列地尔治疗慢性肾衰竭的临床效果,为之后的慢性肾衰竭治疗工作提供更多的借鉴。方法在这次试验中,选择在2018年1月至2019年3月在本院治
空时编码技术是多输入多输出(Multiple Input Multiple Output, MIMO)系统中的关键技术之一,为无线通信领域指出了一条利用空间维度来提高系统容量和(或)可靠性的有效途径。为了在
拥有3500亿元的“国家级”国企基金3月13日再下一城,这家由诚通集团牵头成立的中国国有企业结构调整基金股份有限公司(“国企结构调整基金”)以18亿元成功认购中国国航(601111)2.13亿股,这是该基金迄今为止最大的一笔投资。这支承担着优化国有经济布局结构调整、提升产业集中度、提高国有资本运营效率重任的的基金,再一次触动资本市场。  跟进优良资本  今年1月11日,国企结构调整基金出资9558
近日国家外汇管理局新闻发言人表示,2017年以来,我国跨境资金流出压力明显缓解.这主要得益于近期人民币贬值压力有所缓解,以及监管部门加强对外汇和资本流动的宏观审慎管理,
事件:“手机购物使用率从9.7%到66.4%;每100个手机用户中,29人使用网约车;每10个手机用户中,近4人使用网络外卖;每3个手机用户中,有2个人在使用移动支付.”这五年,围绕一部部