论文部分内容阅读
300bps速率的语音编码技术是超低速率语音编码中重要的研究课题。
为降低语音参数的量化失真,论文提出了一种语音参数平滑算法。平滑算法在不引起听觉上的畸变和降低模型合成语音的听觉质量的情况下,使线谱频率(LSF)参数和能量参数的变化轨迹得到了平滑,提高了两种参数各自的帧间相关性,从而降低了量化失真。在超低速率下,平滑算法可以提高合成语音的可懂度,节省LSF和能量参数的量化比特。因此,平滑算法对超低速率语音编码算法有重要的实际意义。
论文提出并实现了两种基于正弦激励线性预测(SELP)模型300bps声码器算法。应用了平滑算法。在第一种300bps声码器中,提出了参数的多帧联合共同量化技术。在第二种300bps声码器中,提出了一种帧抽取技术。两种声码器的判断韵字测试(DRT)分数均在80%以上,并且合成语音具有一定的自然度。
论文提出两种矢量量化快速搜索算法。第一种快速搜索算法针对距离测度没有加权的矢量量化运算,综合利用子矢量的均值和方差参数,构造了一个判决不等式来排除不可能的码字。其性能要优于以往的几种基于不等式判决的快速搜索算法。第二种快速搜索算法针对距离测度带有时变加权的矢量量化运算,利用子矢量的和这个参数构造了一个码字排除不等式。快速搜索算法应用在LSF参数的多帧多级矢量量化算法中,运算时间可以下降到全局搜索算法的66%左右。
传统码本激励线性预测(CELP)算法很难将速率降到2kb/s。论文采用波形叠接相加算法,实现了一种CELP2kb/s声码器,同时保证了相对较高的合成语音质量。