论文部分内容阅读
视频作为多媒体技术的主要应用,在人们的生活中扮演着重要的角色。最新的视频编码标准HEVC提供了更高的视频压缩比,让高清视频更容易存入移动端或是通过网络传播。而随着高清视频的普及和通信技术的发展,在无线信道或是网络中观看高清视频的业务已经受到越来越多人的关注。在有限的信道环境中传送视频就需要用到HEVC的核心技术之一码率控制。最新的码率控制提案JCTVC-K0103所提出的R-lambda模型能够有效的在编码过程中对输出码率进行控制。但当前的码率控制算法对于不同的视频无法依据其纹理特性来为编码单元分配比特,其后果有可能造成缓冲器的溢出甚至是直观视觉质量的下降。而场景切换问题是码率控制研究中的重点问题,有效的处理场景切换问题将会有助于进一步控制码率。为了克服上述问题,本文研究了如何利用支持向量机的分类特性解决不同特性视频之间的码率分配问题。支持向量机是机器学习的一个重要分支,其实质是一个二分类分类器,可以利用它对视频进行分类。如何利用支持向量机改进码率控制算法将是本文的重点。本文首先介绍了HEVC的编码框架及经典码率控制提案JCTVC-K0103,重点介绍了K0103的整个控制流程;之后又介绍了支持向量机的原理及如何由二分类模型转为多分类模型,通过比较与分析这些多分类模型并从中选出做适合本文的模型,即有向无环图多分类模型。在此基础上,本文用编码输出比特数作为视频分类的标准,并将这一视频分类与视频本身的纹理特性相连接,得出了能够依据视频帧纹理复杂度对当前视频帧所需比特数进行评估的机器学习模型;然后,利用已知模型给当前视频帧进行分类,从而进一步确定当前帧或当前单元所需的比特数,实现依据纹理特性对帧或是编码单元进行比特分配。为了有效解决场景切换问题,本文对GOP级和CU级的比特分配算法进行了改进。之后对于R-lambda模型的更新参数无法随场景切换而变化的问题,本文在检测到发生场景的帧后,依据场景切换帧的纹理特性结合支持向量机训练出的模型来改进R-lambda模型的参数更新机制。实验结果证明,本文提出的码率控制算法较提案JCTVC-K0103在BD-rate上有了提高,并且误比特率也控制在了一定的范围内。