论文部分内容阅读
语音信号处理中,线性预测分析技术广泛应用于综合滤波器、感觉加权滤波器以及对数增益滤波器,并且发挥着极其重要的作用。本文以提高编码算法的合成语音质量为目的对G728算法进行改进,提出了一种混合H-LPC(Auditory-Acoustic-Hybrid-LPC)系数,兼具听觉特性与声学特性。实验表明,提出的H-LPC可以改善合成语音的质量,对编码算法的研究有积极意义。
本文首先介绍了H-LPC的求解算法,LPC美尔倒谱系数(LPCMCC)是基于声学模型产生的,而美尔倒谱系数(MFCC)是基于听觉系统产生的,以二者的区别和联系为基础,求得H-LPC。本文围绕LPC的倒谱系数(LPCC)推导得出美尔倒谱系数(LPCMCC)的公式而展开,详细介绍并演示了公式的正向推导和逆向推导。基于原理分析与算法实现的不同,采用MFCC系数调整LPCMCC系数,使之能够最大程度地保留声学特性的同时,引入并增强其听觉特性,根据前述公式的逆推,再把这种听觉特性反馈到调整之后的LPC系数上,即H-LPC系数。
本文对LPC系数进行了PSD功率谱密度估计检测,目的是检测H-LPC系数在加入听觉特性后,声学特性是否损耗以及损耗的程度。为了实验结果易于比较,选用AR模型功率谱估计中的Yule-Walker法估计LPC与H-LPC的PSD,选用周期图法求解原始语音的PSD。实验结果表明,H-LPC的PSD与传统LPC的PSD相比,呈现出一定程度的减弱,但是已经基本达到目前LPC的应用要求,对于原始语音PSD的拟合度达到了90%以上。
具有后向基音检测的LD-aCELP编码算法,以降低码率为目的对G.728算法进行了改进,编码速率由16kbit/s降低至8kbit/s。本文在LD-aCELP编码算法的基础上,将H-LPC系数加入其综合滤波器中,得到合成语音,然后进行收听以及PESQ检测。实验结果表明,改进后的算法比LD-aCELP算法的合成语音质量高,加入H-LPC的LD-aCELP算法的平均信噪比SNR值和PESQ值都有所改进。