论文部分内容阅读
数字编码语音在传输中将会遇到各种问题,如语音帧的丢失及不同语音编码标准的互连。前者将导致语音质量的下降,在利用基音预测的码激励线性预测(CELP)编码语音中,还会导致错误传播,因此,需要进行丢帧补偿,以提高解码语音质量;后者需要在保持较高的语音质量和较低的算法复杂度的前提下,直接将一种标准的语音编码参数转换为另一种标准的语音编码参数,即智能转码。
近期的丢帧补偿大多是在解码端进行的,虽然不会增加码率,但是很难减轻浊音端点丢失所导致的错误传播,而编码端进行的鲁棒编码,如前向纠错编码、多描述编码等,往往带来比特速率的明显增加。传统的级联转码(Tandem transcoding)可以对任何编码的语音进行转码,但是它带来语音质量下降、时延大等问题,同时,一般的智能转码大多是在CELP窄带语音编码标准之间进行的,对于宽带语音编码向窄带语音编码的转码,及宽带语音编码之间的转码,则鲜有研究。
在丢帧补偿方面,本论文首先提出一种基于隐马尔可夫模型的线性预测系数(LPC)补偿算法,对LPC参数进行最佳估计;其次,提出一种基于增强保护帧的鲁棒编码算法及丢帧补偿方法。在转码方面,首先重点研究了自适应多速率宽带语音编码器(AMR-WB)到自适应多速率窄带语音编码器(AMR)转码中的LPC参数转换算法,在此基础上,对其它参数的转换提出了探讨;其次,在AMR-WB和变速率多模式宽带语音编码器(VMR-WB)的互操作分析的基础上,提出AMR-WB和VMR-WB之间的转码算法。
本文的研究工作主要包括如下三个方面:
(1)提出了两种基于隐马尔可夫模型(HMM)的宽带语音编码标准G.722.2的LPC参数补偿算法,利用大型HMM模型对LPC参数的转化形式导谱频率(ISF)参数进行建模,利用语音传输中正确接收的ISF参数,估计丢失的ISF参数。第一种算法,首先估计接收的ISF参数最佳HMM状态序列,再利用丢失帧前面的一个ISF参数的对应状态的统计均值替代丢失的ISF参数;第二种算法,利用接收的ISF参数,递推地估计丢失的ISF参数。在此基础上,对激励信号的补偿进行了讨论。和现有的基于插值补偿方法相比,由于本算法可以把握ISF参数的长期演变趋势,因而谱失真较小,补偿的语音更加自然。
(2)提出一种基于增强保护帧的丢帧补偿算法。在简单地介绍帧间独立窄带语音编码iLBC标准的基础上,提出一种预测编码和帧间独立编码结合的混合编码。采用Teager能量算子或者短时特征参数进行浊音端点检测,将浊音端点及其随后若干帧定义为增强保护帧。根据信道的不同状况(以丢帧率或载干比C/I或者丢包率衡量),对增强保护帧采取不同强度的帧间独立编码。将基于基音预测的CELP宽带语音编码,改进为帧间预测编码和帧间独立编码混合的鲁棒编码。在解码端,针对不同的丢帧情况,分别进行补偿。该算法的优点是,可以有效阻止错误传播,即使在浊音端点全部丢失的极端情况,仍然可以获得满意的语音质量,在最一般随机丢帧的情况下,补偿效果优于G.722.2附件Ⅰ的基准补偿效果。
(3)提出了宽带语音编码AMR-WB向窄带语音编码AMR的转码算法,重点研究了合成滤波器即LPC参数的转换,提出了两个转换算法。第1个算法,将AMR-WB的合成滤波器的冲激响应进行采样率转换,利用Prony算法求解转换后AMR的L2C参数;第2个算法,通过AMR-WB的线性预测参数反解出自相关,再对自相关插值,得到AMR的自相关,利用Levinson-Durbin算法求解AMR的线性预测参数。分析与实验表明,算法1的复杂度只有Tandem转码的1/4左右,而算法2的复杂度不到Tandem转码的3/20,两者都低于Tandem转码。其中,算法2在低速率语音编码时浊音的谱失真略低于Tandem转码,在中、高速率语音编码时浊音的谱失真略高于Tandem转码,由于语音的质量主要由浊音决定,算法2的复杂度大大低于Tandem转码,因此,算法2是一种可供选择的合成滤波器转换算法。在合成滤波器转换的基础上,对构成激励信号的其它参数,即基音延迟参数、代数码本及增益等的转换进行了讨论。另外,在对宽带语音编码AMR-WB和VMR-WB之间互操作分析的基础上,探讨了它们之间的转码算法。