论文部分内容阅读
近年来语音编码技术取得了很大的发展,在国际标准化工作中堪称为最活跃的研究领域之一。移动通信和互联网的发展对语音编码算法提出了更高的要求,不仅要求码率较低以增加系统容量,还要求合成语音质量较高以保证通话质量。码流在网络中传输时很可能发生帧擦除现象,帧擦除会导致码流中所包含的语音信息受损,致使解码出的语音质量下降。因此,解决网络传输中的帧擦除问题已成为现今语音与音频编码的研究热点之一。本文针对帧擦除问题进行了研究,提出的帧擦除掩蔽方法可以有效的解决此问题,保证重建语音信号的质量。
首先,本文从变换域角度对擦除帧进行掩蔽。主要考虑的变换有:调制叠接变换(Modulated Lapped Transform,MLT)、修正的离散余弦变换(Modified Discrete Cosine Transform,MDCT)、修正的离散正弦变换(Modified Discrete Sine Transform,MDST)与移位的离散傅立叶变换(Shifted Discrete Fourier Transform,SDFT)。通过对以上变换的性质、相关性与复杂度进行比较分析,最终选定在MLT与MDCT域进行帧擦除掩蔽方法的研究。在变换域,掩蔽方法从变换系数的幅度和符号两方面进行考虑。将所提出的算法应用于G.722.1编码器后,对其进行测试,测试结果显示该算法有效的掩蔽了擦除帧信息。
其次,本文根据语音信号的分形结构,提出一种基于分形的帧擦除掩蔽方法。该方法基于G.722.1编码算法实现,结合语音的特点并利用分形方法对擦除帧进行掩蔽,从而提高发生帧擦除情况时合成语音的质量。经ITU-T的客观PESQ(Perceptual Evaluation of Speech Quality)评测,在发生帧擦除现象时,该方法能够有效的提高解码语音质量。
最后,本文将所提出的基于分形的帧擦除掩蔽方法应用于一种嵌入式语音频编码器中,通过测试表明该算法满足编码器的要求,取得了良好的效果。