论文部分内容阅读
基于隐马尔科夫模型(HMM)和循环神经网络(RNN)的HMM-RNN混合模型在语音识别中取得了很大的成功.由于RNN的计算过程本身就是上下文相关的,相邻帧的重合部分增加了整个系统的训练时间.针对上述问题,使用连接时序分类(CTC)来代替HMM跟RNN结合,并在语音分帧过程中去除相邻帧之间的重合部分,使用TIMIT语音数据集,进行音素上的识别任务,并且实验结果表明CTC-BLSTM模型在音素上的识别率要高于HMM-BLSTM混合模型,CTC-BSLTM在去除帧重合后能够大幅提高系统的训练效率并且保证识别率大