论文部分内容阅读
【摘 要】随着通信、计算机网络等技术的飞速发展,语音压缩编码技术在数字移动通信、卫星通信、多媒体技术及IP电话网中得到了快速发展和广泛应用。庞大的语音信号数据给存储和传输带来巨大的压力,所以语音压缩和语音编码技术显得越来越重要。基于G.711语音压缩算法,深入浅出地分析了它在单频信号、DTMF信号中的传输损伤等性能。
【关键词】语音压缩编码;G.711;VoIP;PCM;
1 引言
语音是人类相互进行交流使用最多、最自然、最基本也是最重要的信息载体。语音的产生是一个复杂的过程,包括心理和生理等方面的一系列动作。由于其特殊的作用,人们历来十分重视对语音信号和语音通信的研究[1][2]。随着当今世界数字技术的飞速发展,数字业务量的急剧增长,如何在提供高质量语音的基础上用最低的码率来传送和储存数字语音信号,以增加现有信道的带宽利用率[3][4]、安全性以及降低成本等已越来越受到人们的重视。在高度信息化的今天,语音处理的一系列技术及应用已经成为信息社会不可或缺的重要组成部分。本文将重点讨论语音压缩编码算法[5]中最常见的一种算法,即G.711在网络传输上的一些性能和优缺点。
2 G.711理论简介
G.711是在电路交换电话网络中普遍使用的一种波形编码算法[6][7][8][9]。波形编码方式是能够忠实地表现波形的编码方式。语音信号的波形编码力图使重建的语音波形保持原语音信号的波形状态。这类编码器通常是将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话音质量好、抗噪抗误码能力强等特点,但是波形编码所需的编码速率比较高,其速率一般在16kbit/s~64kbit/s[10][11]。G.711也称为PCM(脉冲编码调制)[12][13],是国际电信联盟制订出来的一套语音压缩标准,主要用于电话业务。它主要用脉冲编码调制对音频采样,以8KHZ作为抽样频率,如果使用统一量化方法,话音中通用的信号层次的每一个样本就要12比特来表示,这就产生了96kb/s的比特率。如果使用不统一的量化方式,表示一个样本只需要8比特。它利用一个64kbps未压缩通道传输语音信号。G.711有U律和A律两个类型,U律主要运用于北美和日本,A律主要运用于欧洲和世界其他地区,两者之间的区别主要在于不统一量化的使用方式。对于较低的信号层次来讲,A律对于信号的歪曲程度相比U律更小一些,这是因为它对一个较大的范围内的低层次信号提供较小的量化间隔,但以较大范围内的高层次信号的较大量化层次为代价。A律和U律都提供了良好的语音质量,并且Mos等级都在4.3左右。
3 G.711编码对单频信号传输损伤分析
VoIP编码会给单频信号带来损伤,但不同编码方式,对单频信号的传输损伤大小不同。G.711是波形编码,直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。对于单频信号,波形编码损伤较小,混合编码损伤较大;下面通过实验,从频率偏移和功率衰减两个角度,分析G.711编码对单频信号传输损伤。
A、实验步骤:(1)采用Matlab2010a实验仿真平台,利用WAVWRITE函数生成采样频率8000HZ,时长500ms,频率分别为300Hz,305Hz,310Hz,…,3400Hz的单频信号波形文件。(2)不同频率的单频信号分别经过G.711编码,对编码前后的单频信号进行分析,分别计算每个单频信号在编码前后的频偏和功率,最后画出频偏—频率曲线和功率—频率曲线。(3)在(1)中的波形文件中加入高斯白噪声,使信噪比为10dB,重复(2)过程。
B、G.711实验结果:
(1)无噪声情况
(2)有噪声情况
C、实验结果分析:
(1)从频偏的角度分析:在有噪声和无噪声情况下,单频信号在G.711编解码前后,频偏均在0.5%以下,且随着频率的升高呈现单调递减的趋势。(2)从功率的角度分析:在有噪声和无噪声情况下,G.711解码后的单频信号功率与编码前进行比较,没有明显的衰减。只是有噪声情况下的功率相对于无噪声情况下的功率,有一定的衰减。
D、总结
从频偏和功率两个角度考虑,在G.711编码方式下,单频信号的频偏和功率衰减较小,损伤较小。
4 G.711编码对DTMF信号传输损伤分析
DTMF信号在VOIP通信通道传输过程中,采用VOIP压缩编码以降低数码率,但不可避免的引入编码损伤。下面主要在有高斯白噪声和无噪声情况下,从频偏和功率两个方面来分析G.711压缩编码对DTMF信号的损伤。
A、实验步骤:(1)采用Matlab2010a实验仿真平台,利用WAVWRITE函数分别生成16个数码的DTMF信号波形文件,总时长100ms,包括50ms的DTMF时段以及50ms的静音时段。计算低频和高频的频偏,以及低频/高频功率比;画出时域和频域图。(2)将16个数码的DTMF信号分别经过G.711编码,对编码后的DTMF信号进行分析;计算每个数码低频和高频的频偏,以及低频/高频功率比;画出时域和频域图。(3)在(1)中生成DTMF信号的过程中,加入高斯白噪声信号,使得信噪比为10dB,重复(2)。
B、G.711实验结果:
(1)无噪声情况:经过G.711编码后,从时域和功率谱上看,DTMF信号没有明显的失真;且频偏和低频/高频功率比相对于编码前来说,也没有出现较大的偏差。G.711编解码前后,频偏均在±0.5%范围内,低频/高频功率比均在±0.5dB范围内。下面列出两幅具有代表性的数码时频域图:
上图是数码’8’的时频域图,G.711编解码前后,数码’8’的频偏和功率比均比较小。
(2)有噪声情况:引入高斯白噪声,DTMF信号在G.711编解码之后,仍没有明显的失真。频偏均在±0.6%范围内,低频/高频功率比均在±1.25dB范围内。下面列出两幅具有代
C、G.711实验结果分析:(1)G.711编解码前后,DTMF信号的时频域均没有出现明显的失真。(2)G.711编解码前后,除数码’8’外,其余数码的低频频偏均大于高频频偏;所有数码的频偏和低频/高频功率比均在信号检测要求范围内,不影响DTMF信号的检测。(3)加入高斯白噪声信号,DTMF信号也没有明显的失真,频偏和低频/高频功率比也没有较大的改变。
D、总结:无噪声情况下,DTMF信号在G.711编码后,没有明显的失真,频偏和低频/高频功率比也较小;加入高斯白噪声情况下,在G.711编码后,DTMF仍不会有明显的失真;综上所述,G.711编码对DTMF信号的损伤较小。
5.小结
G.711由于采用的是波形编码算法,具有高质量和低时延的语音,主要的缺点是需要64Kb/s的带宽。但是其算法复杂度小,压缩比小(CD音质>400kbps),编解码延时最短(相对于其他技术),自然度较好。
参考文献:
[1]曹志刚,钱亚生. 现代通信原理[M].北京:清华大学出版社,1992.
[2]朱光华. 移动通信技术[M].杭州:浙江科学技术出版社,1991.
[3]胡航.语音信号处理「M].哈尔滨:哈尔滨工业大学出版社,2000
[4]王炳锡.语音编码[M].西安:西安电子科技大学出版社,2002.
【关键词】语音压缩编码;G.711;VoIP;PCM;
1 引言
语音是人类相互进行交流使用最多、最自然、最基本也是最重要的信息载体。语音的产生是一个复杂的过程,包括心理和生理等方面的一系列动作。由于其特殊的作用,人们历来十分重视对语音信号和语音通信的研究[1][2]。随着当今世界数字技术的飞速发展,数字业务量的急剧增长,如何在提供高质量语音的基础上用最低的码率来传送和储存数字语音信号,以增加现有信道的带宽利用率[3][4]、安全性以及降低成本等已越来越受到人们的重视。在高度信息化的今天,语音处理的一系列技术及应用已经成为信息社会不可或缺的重要组成部分。本文将重点讨论语音压缩编码算法[5]中最常见的一种算法,即G.711在网络传输上的一些性能和优缺点。
2 G.711理论简介
G.711是在电路交换电话网络中普遍使用的一种波形编码算法[6][7][8][9]。波形编码方式是能够忠实地表现波形的编码方式。语音信号的波形编码力图使重建的语音波形保持原语音信号的波形状态。这类编码器通常是将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话音质量好、抗噪抗误码能力强等特点,但是波形编码所需的编码速率比较高,其速率一般在16kbit/s~64kbit/s[10][11]。G.711也称为PCM(脉冲编码调制)[12][13],是国际电信联盟制订出来的一套语音压缩标准,主要用于电话业务。它主要用脉冲编码调制对音频采样,以8KHZ作为抽样频率,如果使用统一量化方法,话音中通用的信号层次的每一个样本就要12比特来表示,这就产生了96kb/s的比特率。如果使用不统一的量化方式,表示一个样本只需要8比特。它利用一个64kbps未压缩通道传输语音信号。G.711有U律和A律两个类型,U律主要运用于北美和日本,A律主要运用于欧洲和世界其他地区,两者之间的区别主要在于不统一量化的使用方式。对于较低的信号层次来讲,A律对于信号的歪曲程度相比U律更小一些,这是因为它对一个较大的范围内的低层次信号提供较小的量化间隔,但以较大范围内的高层次信号的较大量化层次为代价。A律和U律都提供了良好的语音质量,并且Mos等级都在4.3左右。
3 G.711编码对单频信号传输损伤分析
VoIP编码会给单频信号带来损伤,但不同编码方式,对单频信号的传输损伤大小不同。G.711是波形编码,直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。对于单频信号,波形编码损伤较小,混合编码损伤较大;下面通过实验,从频率偏移和功率衰减两个角度,分析G.711编码对单频信号传输损伤。
A、实验步骤:(1)采用Matlab2010a实验仿真平台,利用WAVWRITE函数生成采样频率8000HZ,时长500ms,频率分别为300Hz,305Hz,310Hz,…,3400Hz的单频信号波形文件。(2)不同频率的单频信号分别经过G.711编码,对编码前后的单频信号进行分析,分别计算每个单频信号在编码前后的频偏和功率,最后画出频偏—频率曲线和功率—频率曲线。(3)在(1)中的波形文件中加入高斯白噪声,使信噪比为10dB,重复(2)过程。
B、G.711实验结果:
(1)无噪声情况
(2)有噪声情况
C、实验结果分析:
(1)从频偏的角度分析:在有噪声和无噪声情况下,单频信号在G.711编解码前后,频偏均在0.5%以下,且随着频率的升高呈现单调递减的趋势。(2)从功率的角度分析:在有噪声和无噪声情况下,G.711解码后的单频信号功率与编码前进行比较,没有明显的衰减。只是有噪声情况下的功率相对于无噪声情况下的功率,有一定的衰减。
D、总结
从频偏和功率两个角度考虑,在G.711编码方式下,单频信号的频偏和功率衰减较小,损伤较小。
4 G.711编码对DTMF信号传输损伤分析
DTMF信号在VOIP通信通道传输过程中,采用VOIP压缩编码以降低数码率,但不可避免的引入编码损伤。下面主要在有高斯白噪声和无噪声情况下,从频偏和功率两个方面来分析G.711压缩编码对DTMF信号的损伤。
A、实验步骤:(1)采用Matlab2010a实验仿真平台,利用WAVWRITE函数分别生成16个数码的DTMF信号波形文件,总时长100ms,包括50ms的DTMF时段以及50ms的静音时段。计算低频和高频的频偏,以及低频/高频功率比;画出时域和频域图。(2)将16个数码的DTMF信号分别经过G.711编码,对编码后的DTMF信号进行分析;计算每个数码低频和高频的频偏,以及低频/高频功率比;画出时域和频域图。(3)在(1)中生成DTMF信号的过程中,加入高斯白噪声信号,使得信噪比为10dB,重复(2)。
B、G.711实验结果:
(1)无噪声情况:经过G.711编码后,从时域和功率谱上看,DTMF信号没有明显的失真;且频偏和低频/高频功率比相对于编码前来说,也没有出现较大的偏差。G.711编解码前后,频偏均在±0.5%范围内,低频/高频功率比均在±0.5dB范围内。下面列出两幅具有代表性的数码时频域图:
上图是数码’8’的时频域图,G.711编解码前后,数码’8’的频偏和功率比均比较小。
(2)有噪声情况:引入高斯白噪声,DTMF信号在G.711编解码之后,仍没有明显的失真。频偏均在±0.6%范围内,低频/高频功率比均在±1.25dB范围内。下面列出两幅具有代
C、G.711实验结果分析:(1)G.711编解码前后,DTMF信号的时频域均没有出现明显的失真。(2)G.711编解码前后,除数码’8’外,其余数码的低频频偏均大于高频频偏;所有数码的频偏和低频/高频功率比均在信号检测要求范围内,不影响DTMF信号的检测。(3)加入高斯白噪声信号,DTMF信号也没有明显的失真,频偏和低频/高频功率比也没有较大的改变。
D、总结:无噪声情况下,DTMF信号在G.711编码后,没有明显的失真,频偏和低频/高频功率比也较小;加入高斯白噪声情况下,在G.711编码后,DTMF仍不会有明显的失真;综上所述,G.711编码对DTMF信号的损伤较小。
5.小结
G.711由于采用的是波形编码算法,具有高质量和低时延的语音,主要的缺点是需要64Kb/s的带宽。但是其算法复杂度小,压缩比小(CD音质>400kbps),编解码延时最短(相对于其他技术),自然度较好。
参考文献:
[1]曹志刚,钱亚生. 现代通信原理[M].北京:清华大学出版社,1992.
[2]朱光华. 移动通信技术[M].杭州:浙江科学技术出版社,1991.
[3]胡航.语音信号处理「M].哈尔滨:哈尔滨工业大学出版社,2000
[4]王炳锡.语音编码[M].西安:西安电子科技大学出版社,2002.