论文部分内容阅读
低信噪比下语音频率参数估计一直是语音信号处理的一个很重要的研究方向,尤其是基频参数及共振峰参数对语音识别、语音合成及语音的压缩编码等,都具有很重要的理论和实际意义。本文从研究语音信号处理的一些基础性理论入手,着重研究了语音信号的产生模型与线性预测分析,抗噪理论与方法,分析了在低信噪比下提高线性预测估计的方法,改进了在低信噪比下提取语音基频和共振峰频率的方法,并在语音信号的预处理和后处理上做了一定的改进。通过在Matlab平台上进行仿真实验表明,新的方法能得到较小的线性预测误差,提高线性预测的准确性。本文的主要研究工作如下:首先,本文简要分析了语音信号的产生及特点、语音信号产生模型及线性预测分析理论、预加重和分帧等预处理及其端点检测的常用方法分析等。考虑为提高求取的线性预测系数的准确性,线性预测分析的方法采用协方差格型法,并对其原理进行较详细的分析。另外,利用清音和浊音信号在过零率上概率分布的差异,结合自相关函数法检测浊音信号良好的性能,提出了一种适合低信噪比下浊音端点检测方法,并在Matlab平台上进行了实验,效果较好。其次,分析语音信号基音频率和共振峰频率检测的常用方法。就基频检测,分析比较了自相关函数法、平均幅度差函数法、倒谱法及简易逆滤波法。在低信噪比下,自相关函数法易出现倍频或半频现象,检测效果较差,倒谱法和平均幅度差函数法性能下降严重,简易逆滤波法较其他三种方法性能要好。对于共振峰频率检测的常用方法,短时傅里叶变换法受噪声影响较大,低信噪比下对于共振峰估计误差较大;倒谱法可以很好地实现声道与激励的分离,但一般所得到的倒谱包络点数较少,精度不高,且倒谱法本身运算量较大,受噪声的影响严重,不适合低信噪比下进行检测;线性预测法相比其他两种方法效果,较为实用。接着,分析讨论了噪声对信号的影响,以及减少噪声的原理和方法。考虑到线性预测(LPC)阶数的选取对线性预测谱包络的影响很大,阶数较低时,线性预测谱包络较为滑不够准确,阶数较高时,所得的谱包络受基频的影响严重且常常比较尖锐,而基于语音信号幅度谱包络的求取的线性预测系数可以很好地克服预测系数选取选取带来的误差。因此,本文讨论用降噪之后语音信号的幅度谱来求取线性预测系数,并且选用协方差格型法的方法进行LPC分析,提高预测系数的准确性,并用得到的LPC系数进行逆滤波求取基音频率,谱包络分析求取前三个共振峰的频率。并将该方法得到的语音频率参数和简易逆滤波法求取基音频率及线性预测法求取共振峰频率进行比较,通过Matlab的仿真可知,该方法在低信噪比下误检率较低,性能较好。另外,对于语音信号的后处理,本文分析讨论了一种中值滤波方法,考虑到语音频率检测中可能出现野点等情况,在求取语音频率参数之后,用所讨论的中值滤波方法进行滤波,可得到较平滑的语音频率参数轨迹。然后,在Matlab平台上通过其自带的GUI设计界面,将所设计的方法进行整合,生成一个能检测出基音频率和前三共振峰频率的软件。该软件能实现从本地上传语音文件和现场录音两种方式得到语音数据,可通过选择相应的控制选项将检测结果显示在界面上,并可选择某帧数据将其具体的参数数据显示在界面右边。最后,对全文所做的工作进行概括分析,并对语音频率参检测的以后的研究方向前景进行简单的介绍和展望。