论文部分内容阅读
ITU-T G.728语音编码标准,具有低延迟、高质量语音编码特性,被广泛应用在数据通信的各个领域,但其算法复杂度高,运算量庞大。本研究以降低编码复杂度为目的对G.728算法进行修改,使用并改进了一种降低码书搜索复杂度的方法——直接矢量量化方法。LD-CELP算法中,激励码书中的1024个码字一次一个地通过由综合滤波器和感觉加权滤波器组成的级联滤波器,然后与归一化的目标矢量进行比较,选出均方误差最小的激励码字。级联滤波器运算在整个编码过程中所占的运算量比较大,针对此问题,提出将直接矢量量化方法引入到LD-CELP语音编码算法的思想。直接矢量量化方法的主要思想就是在码书搜索过程中,去除级联滤波器的滤波运算,同时利用感觉加权逆滤波器来完成语音的合成工作。本研究实现了直接矢量量化方法与LD-CELP语音编码算法的结合,同时对感觉加权逆滤波器参数的选取、系数的更新过程以及修改之后的码书搜索过程都给予了详细的论述。实验结果表明,在运算速度方面,直接矢量量化LD-CELP比原始LD-CELP算法有了明显提高,且语句越长越明显,81句的时候可以快4.7秒。同时对滤波运算参与完成的能量运算和逆时卷积运算进行了运算量分析,乘法运算量降低了75%,加法运算量降低了77.78%,在信噪比方面和主观听觉方面,质量并没有下降。使用直接矢量量化方法后,需要重新训练码书。因此,本文接着研究了神经网络在矢量量化码书设计中的应用。自组织特征映射(Self-OrganizingFeature Map,SOFM)神经网络算法由于其受初始码书影响小、抗信噪误码能力强、适应性强等特点被广泛应用于码书设计。它是一种具有侧向联想能力的双层(输入层和输出层)结构网络,采用Kohonen竞争学习算法,改变获胜节点及相邻节点的权值,实现输入矢量到输出矢量空间的特征映射,权值的集合即组成码书。本研究在深入分析SOFM神经网络理论的基础上,阐述了在语音编码算法中,SOFM的学习速率和邻域函数的选择问题,并进一步提出了两个改善网络性能的方法:一是对输入训练矢量和连接权矢量进行归一化处理;二是将网络权值的自适应调整过程分解为排序和收敛两个阶段。结果表明,通过这些改进方法,使SOFM网络的性能得到了进一步的改善。SOFM神经网络训练的码书生成语音的分段信噪比比LBG算法平均提高0.73dB,同时码书重构的时间仅占LBG算法时间的10.85%。