论文部分内容阅读
随着移动互联网的快速发展,移动终端上各类型语音、音乐等音频应用需求不断增强。然而,无线移动网络的信道环境复杂多变,导致移动接收端所获得的数据容易出现误码失真,语音传输质量不高、音频通信服务质量较差。现有移动音频的丢帧隐藏技术研究主要面向随机少量语音或音频丢帧的应用场景,无法有效应对突发大量连续丢帧的应用场景。针对上述问题,本论文开展相关研究。本论文在充分研究现有移动音频编码标准AMR-WB+和AVS-P10的基础上,深入讨论移动音频编码的丢帧隐藏技术方法,针对主流的ACELP编码器和TCX编码器,提出了新的满足移动网络高恢复效率、低延时的音频丢帧隐藏方法,使得编码端不添加额外的纠错信息到传输码流中,且解码端不增加延时。主要研究内容和成果概括如下:1.提出了ACELP编码器的自适应丢帧隐藏方法基音周期和ISF参数都是基于ACELP编码的音频编码的重要参数,现有的AVS-P10标准中的语音编码器的丢帧隐藏方法主要是对一些单帧或间断少量丢帧情况下的处理效果较好,而在随机连续丢帧的情况下,丢帧处理延迟较高且语音恢复质量效果欠佳。针对该问题,论文提出了一种自适应的丢帧隐藏方法A-PLC,旨在根据单帧丢失还是多帧连续丢失进行判定,并自动、相适应的采用不同的丢帧隐藏方法,用于恢复丢失帧的基音周期和ISF参数。实验通过与AVS-P10标准中原有方法相对比,其结果表明:A-PLC客观测试PESQ平均得分有约0.13分的提升,主观听力测试的平均CMOS得分提高约0.04分,运算处理时间降低了约10%的时间。2.提出了基于HMM的ACELP编码器丢帧隐藏方法当前主流的语音编解码器对丢失帧的参数恢复方法,主要是基于丢失帧前后正确参数信息进行替换或线性预测来估计丢失的参数值,即只关注了语音信号的局部特征,而忽略了从整体上把握语音信号的全局特征,因而在出现突发大量丢帧的情况下,这些方法恢复的语音信号的听觉感知失真较大。针对该问题,论文提出了基于HMM的丢帧隐藏方法H-PLC,通过分析语音信号在更大范围的上下文关系的统计学变化来选择合适的丢帧隐藏策略。利用连续HMM把每帧语音信号的编码参数向量作为观察值,一个语音参数向量的序列看作HMM产生的连续概率密度函数,在解码器通过HMM跟踪语音参数观察值的变化时,决定每一时刻的最可能的信号状态。当包丢失时,基于HMM的恢复方法使用状态和密度函数信息,计算丢失帧参数的估计值。实验结果表明:H-PLC相比AVS-P10标准的语音编码器原有方法,客观语音测试PESQ平均分提高约0.33分,主观语音测试MOS平均分能够提高约0.32分。3.提出了基于增益控制的TCX编码器丢帧隐藏方法现有变换域丢帧隐藏方法多数采用增益因子来控制谱系数幅度的恢复,这种方法无法有效反映谱系数在不同帧间幅度变化的情况,从而造成恢复的音频信号失真较大。针对该问题,论文提出了一种基于增益控制的丢帧隐藏方法Gain-C,采用线谱频率系数距离用于表征滤波器稳定性,在此基础上,建立稳定性因子和增益控制因子的线性变换关系,从而控制丢失帧谱系数幅度恢复。实验结果表明:在变换码激励模式下,Gain-C与AMR-WB+标准方法相比,恢复的音频信号的平均加权信噪比约有0.05dB的提高,MUSHRA听音测试平均分约有1.5分的提高。论文中提出的移动音频丢帧隐藏方法可直接编码后嵌入到移动音频解码器丢帧隐藏处理部分。相关研究结果表明:提出的移动音频丢帧隐藏方法在丢帧恢复质量和效率方面优于当前主流移动音频编码标准AMR-WB+和AVS-P10中所采用的方法。