基于SOFM的直接矢量量化方法在LD-CELP语音编码算法中的应用

来源 :太原理工大学 | 被引量 : 6次 | 上传用户:a683999700
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ITU-T G.728语音编码标准,具有低延迟、高质量语音编码特性,被广泛应用在数据通信的各个领域,但其算法复杂度高,运算量庞大。本研究以降低编码复杂度为目的对G.728算法进行修改,使用并改进了一种降低码书搜索复杂度的方法——直接矢量量化方法。LD-CELP算法中,激励码书中的1024个码字一次一个地通过由综合滤波器和感觉加权滤波器组成的级联滤波器,然后与归一化的目标矢量进行比较,选出均方误差最小的激励码字。级联滤波器运算在整个编码过程中所占的运算量比较大,针对此问题,提出将直接矢量量化方法引入到LD-CELP语音编码算法的思想。直接矢量量化方法的主要思想就是在码书搜索过程中,去除级联滤波器的滤波运算,同时利用感觉加权逆滤波器来完成语音的合成工作。本研究实现了直接矢量量化方法与LD-CELP语音编码算法的结合,同时对感觉加权逆滤波器参数的选取、系数的更新过程以及修改之后的码书搜索过程都给予了详细的论述。实验结果表明,在运算速度方面,直接矢量量化LD-CELP比原始LD-CELP算法有了明显提高,且语句越长越明显,81句的时候可以快4.7秒。同时对滤波运算参与完成的能量运算和逆时卷积运算进行了运算量分析,乘法运算量降低了75%,加法运算量降低了77.78%,在信噪比方面和主观听觉方面,质量并没有下降。使用直接矢量量化方法后,需要重新训练码书。因此,本文接着研究了神经网络在矢量量化码书设计中的应用。自组织特征映射(Self-OrganizingFeature Map,SOFM)神经网络算法由于其受初始码书影响小、抗信噪误码能力强、适应性强等特点被广泛应用于码书设计。它是一种具有侧向联想能力的双层(输入层和输出层)结构网络,采用Kohonen竞争学习算法,改变获胜节点及相邻节点的权值,实现输入矢量到输出矢量空间的特征映射,权值的集合即组成码书。本研究在深入分析SOFM神经网络理论的基础上,阐述了在语音编码算法中,SOFM的学习速率和邻域函数的选择问题,并进一步提出了两个改善网络性能的方法:一是对输入训练矢量和连接权矢量进行归一化处理;二是将网络权值的自适应调整过程分解为排序和收敛两个阶段。结果表明,通过这些改进方法,使SOFM网络的性能得到了进一步的改善。SOFM神经网络训练的码书生成语音的分段信噪比比LBG算法平均提高0.73dB,同时码书重构的时间仅占LBG算法时间的10.85%。
其他文献
随着通信网络技术和终端设备的不断发展,用户业务可选择的终端和接入方式逐渐多样化。为了克服单一无线接入技术的性能瓶颈,充分利用用户周围的终端和网络资源,提升业务体验,
光纤光栅是近年来发展最为迅速、应用最为广泛的光纤无源器件之一。由于它的许多独特的优点,在光纤通信、光纤传感等领域具有广阔的应用前景。以光纤光栅技术为基础的光纤光
流媒体技术是应用于互联网上,支持音视频文件边下载边播放的网络传输技术,为用户提供播放网络文件与播放本地文件相同的感受。因为音视频文件数据量非常庞大,同时又要求具有
近年来,对称稀疏直线阵列和共形阵列以其优越的系统性能在通讯、雷达探测、导航等许多领域成为研究热点,受到广泛研究。本文的主要工作是:(1)研究对称稀疏直线阵列天线在最大
物体的颜色取决于物体表面对入射光的反射,即取决于物体本身对可见光范围内电磁波的反射率。大部分的成像设备采用RGB传感器进行图像采集,RGB传感器件中有感应R、G、B三个颜
图像边缘包含了一幅图像的绝大部分主要信息,边缘的提取在图像处理和机器视觉中占据着非常重要的作用。在图像的获取、传输和存储过程中往往会因各种原因引入噪声,因此,如何