论文部分内容阅读
随着Internet的迅速发展、网络带宽的提高以及音频视频编码技术的发展,VoIP(voice over internet protocol)在中国的业务也在迅速地增长。与传统PSTN电话相比,VoIP拥有方便快捷,价格低廉的巨大优势。但是在这些优势背后,VoIP也有语音质量缺乏保障的缺点。因此,VoIP语音质量越来越受人们重视。评判VoIP语音质量的分主观和客观两种方法。主观方法为MOS(MeanOpinion Score),它是由若干经过训练的评测者对所听到的语音进行评分。客观方法常用的有两种:PESQ(perceptual evaluation of speech quality)和E-model。PESQ方法将参考信号和受损信号都分成较短的交迭样本块,计算每一块的傅立叶变换系数,并比较他们的系数,最后给出一个PESQ得分,该得分与MOS的范围相近。但是以上两种方法的测量不是基于数据网络的,不能反映诸如延时、抖动和丢包等数据网络特有的问题,没有考虑网络故障对用户感觉造成的影响,因而不适用于VoIP语音监测。国际电信联盟提出的E模型非常适用于在数据网络上分析语音质量,能反映诸如延时、抖动和丢包等数据网络特有的问题,是目前应用最为广泛的VoIP语音质量评测方法之一。但是这个模型对于网络延迟抖动的考虑并不充分。目前关于E模型的研究主要有两种方向,一种是在某些特定环境下的应用,如在无线网络中的应用;另一种就是在E模型中引入抖动这个参数。但是目前的研究中抖动因子的引入多伴随着网络自相似系数及抖动缓存大小。然而网络自相似系数分析,要求的数据量比较大,导致模型的实时性很差,另一方面客户端抖动缓冲大小对网络监测软件来说也是未知参数。本文在总结前人研究的基础上,提出了一种新的计算抖动对语音损伤的方法。这种方法分析了抖动造成的丢包对语音的损伤及抖动引起的延迟变化对语音的损伤。将两者结合作为抖动对语音质量的损伤因子,引入E模型中,并通过实验比较验证新模型的监测效果。