论文部分内容阅读
语音识别是机器通过模式识别过程把人类的语音信号转变为相应的文本的技术。语音识别拥有广阔的应用前景,同时作为一个交叉学科也具有深远的理论研究价值。
本文首先分析了语音信号的预处理,对语音信号进行了端点检测,滤除了语音信号的无声段和噪声,为语音特征参数的提取提供了有效语音段。在端点检测方面讨论了基于Mel频率倒谱特征的端点检测方法和传统的双门限端点检测方法的性能。相对于传统的双门限端点检测方法,基于Mel频率倒谱特征的端点检测方法具有更高的鲁棒性。
其次本文详细阐述了线性预测倒谱系数(LPCC)及Mcl频率倒谱系数(MFCC)特征参数的提取方法,并提出了改进的LPCCMel特征参数。仿真实验证明使用改进的LPCCMel特征参数的语音识别系统比使用LPCC参数和MFCC参数具有更好的识别率。
最后,本文着重研究DHMM方法语音识别系统,分析、讨论语音识别系统中DHMM状态数选取和码本容量选取的问题。通过对“0-9”十个数字进行了识别实验,得出DHMM状态数为6或7,矢量量化的码本容量为64或128时,可以显著提高系统识别率的结论。