论文部分内容阅读
首先,本文对语音识别领域的国内外研究情况及其发展进行了介绍。同时,深入的分析了语音信号的特点和模型、及其在时域、频域以及Mel域的处理方法。其中包括信号的预处理、信号的短时特征、信号的端点检测方法。针对性的研究了在语音识别中,需要对语音信号进行的处理,分析了典型的语音特征提取方法,并提取到语音信号的MFCC参数。针对特征数据长度不一的问题,本文采用VQ的方法对MFCC进行了处理,将生成的码本作为新的特征,得到了相同维数的语音特征参数。然后,重点研究了神经网络中LVQ网络和SVM的算法,分析了两种算法用在语音识别中的优缺点,并分别使用这两种网络进行训练和识别,得到测试结果。针对两者的特点,本文提出对LVQ的改进,并将改进后的LVQ和SVM结合起来作为一种复合网络LVQ/SVM进行语音识别。该复合网络不仅具有类似于LVQ网络结构简单、分类效率高的优点,也具备了SVM优良的分类特性。并且复合网络在SVM分类器训练和识别时,有接近一对一投票法的训练速度,也能实现和有向无环图法相当的分类器数目,同时有效改善了一对剩余法中数据偏斜的情形。本文通过对相关算法的理论分析和对各种网络的训练结果得到了相应网络的识别结果,并对识别结果进行了分析。本文通过有效的方法将LVQ和SVM进行复合做语音识别,研究结果显示本文提出的改进算法和复合方案是可行的。