论文部分内容阅读
语音是人类交流信息最自然、最有效、最方便的手段,因此大多数通信系统都要包含语音传输的功能。近几十年来,随着信息社会和通信技术的飞速发展,所需传输的数据量呈几何倍数的增长,频率资源因此也变得愈发重要。但是,如何在尽可能低的编码速率上更加有效的对语音信息进行编码传输,同时获得更好的语音质量,长期以来没能得到很好的解决。码激励线性预测(CELP)编码算法具有高质量的合成语音及优良的抗噪声和多次转接性能,如果能够在保证合成语音质量的前提下,进一步降低其编码速率,在实际应用中必然有很大的价值,因此对CELP算法的研究工作是十分有意义的。本文围绕如何在保证语音质量基本不变的情况下进一步降低CELP的编码速率而展开,并在美国联邦标准FED-STD-1016算法的基础上进行了一系列的研究和实验。最终,提出了一种降低编码速率的方案,并进行了实现。本文所取得的研究成果有:1.研究帧长和子帧数的改变对于合成语音质量的影响。首先,通过理论上的分析,论证了帧长和子帧数的改变可以调整语音编码速率。接着,通过大量的实验,验证该方案的正确性。最后,在FED-STD-1016算法的基础上,实现通过帧长和子帧数的改变来调整编码速率的方案。测试结果表明,合成语音比较清晰、自然,验证了算法的可行性。2.改进LSF参数的量化方式。美国联邦标准的FED-STD-1016算法对线性预测的10个LSF参数采用独立、非均匀的标量量化方式,总共用34个比特进行编码传输,约占了总编码比特数的1/4,所占用的比特数较多。本文采用矢量量化方式对LSF参数进行量化编码,可以用十几个比特来表征LSF参数,节约了编码所需的比特数,从而降低编码速率,提高算法的运行效率。3.完成低速率语音编码方案的设计和实现。完整的低速率语音编码方案,结合了帧长和子帧数的改变以及改进LSF参数的量化方式。通过适当的调整帧长和子帧数,同时对LSF参数分配合理的量化比特数,可以实现多种编码速率方案。本文实现的编码速率有:4kb/s,3.6kb/s和3.2kb/s。经过客观测试和主观试听,三种速率下的合成语音均具有良好的可懂度和自然度,语音质量达到了预期的目标。4.算法的定点化。算法的仿真是用浮点程序进行实现的,但算法最终需要应用到实际中去,因此需要对算法进行定点化,为后续的DSP平台移植工作做好准备。本文实现了算法的定点化。在定点化过程中,本文对原始的算法进行了一些优化和改进,进一步提升了算法的运行效率。最后,将定点化程序的结果与浮点程序的结果进行了对比,一方面对定点化的正确性进行了验证,另一方面也对本文设计的低速率编码算法进行了验证。