论文部分内容阅读
在语言学习过程中,发音不准成为学习非母语的一道天然屏障。利用计算机来帮助口语发音教学能提高非母语学习的效益。本文采用的语音评分是基于标准语音的评分;所运用到的技术有特征参数的提取、模式比对方法的设计以及评分机制的建立等。其中特征参数部分采用以下特征参数:音量强度曲线(Magnitude)、基频轨迹(Pitch Contour)以及梅尔倒谱参数(Mel-Frequency CepstralCoefficients);本文所作的工作主要如下:1.端点检测算法,针对传统双门限端点检测算法在噪声环境下的不足之处,对算法细节做出了多处改进。特别是在实际语音处理中,通过多次试验和统计计算出符合含背景噪声的语音信号的短时能量和平均过零率的阈值。2.特征参数提取,总结了目前常用的几种语音识别特征参数,详细分析了传统的线性预测编码系数(Linear Prediction CodingCoefficient,LPCC)、Mel频率倒谱系数(Mel Frequency CepstralCoefficient,MFCC)的原理、优缺点和实现细节。针对MFCC特征的问题,提出的一种基于小波去噪的MFCC提取算法。该算法通过不同尺度的小波基,把含有噪声的信号分解于不同频段中,然后在各个频段分别通过TEO(Teager能量算子)去噪,再把各个频段的输出通过小波重构恢复信号,最后通过Mel滤波器组把小波系数转换成MFCC。3.语音评分机制,通过对一个完整的英语句子进行处理,从而得出语音评分机制。根据语音评分系统的处理流程,分别对标准英语句子和测试英语句子进行预处理,特征参数提取,特征参数规整化及模式比对等过程,求得上述三个参数的相似度,并通过研究各个参数在语音评分机制中所占的比重,建立一个合适的评分机制。