论文部分内容阅读
在当今的社会生活中的各个方面都涉及到了语音通信技术,而语音质量评价则是衡量其通信系统性能的有效方法。其按照评价主体,可分为主观评价和客观评价。主观评价是以人为主体,其真实的反映了人的主观感受,但是当数据量较大时也存在着测量误差大的缺点。客观评价就是用机器来判别语音质量的好坏,具有判别时间短,操作性强,重复灵活性好等优点。目前,国际电信联盟推荐的话音质量客观评价算法是感知语音质量评价(Perceptual Evaluation of Speech Quality,PESQ),主要应用于通信网络和编解码系统的测试,其算法的建模是以人的听觉和感知特性为依据,用程序化的方法对被测的语音系统进行客观的评价,并最终得出与主观评价的耦合度。本文通过查阅大量文献,介绍了语音质量评价的发展过程,并且对PESQ算法形成前的一些算法做了较为深入的研究。在分析P.862标准给出的PESQ算法的基础上,对PESQ算法中的延时校准和听觉模型部分做了改进,提高了语音定位的精确度和客观评价主观耦合度,并且通过谱域变换方法的改进,降低了算法的复杂度,提高了运算效率。目前语音质量评价系统主要有Malden和Psytechnics等公司的产品,其特点是功能全,数据的形象度高,但是其成本高,设计相对复杂。针对上述情况,本文以改进的PESQ算法为核心,以Malden公司的DSLA产品为对比原型,设计了一体化语音评价系统,其特点是廉价,实时性好,具有可移植性。并使用虚拟仪器进行系统的设计,对大量的语音数据进行了系统实现,实验结果表明,测试结果准确,能实时显示评分过程的相关参数,并进一步通过传输函数、电平信息和幅频响应等测试数据分析了被测语音设备的性能。