论文部分内容阅读
语音分类在语音信号处理中起到重要作用。为了提高语音清音/浊音/静默帧的分类准确率,提出了一种基于栈自动编码机(SAE)的语音分类新方法。该方法由SAE和Softmax分类器组成的深度神经网络实现。首先,提取5种语音参数:子带信号强度,残差信号峰值,增益,基音周期和线谱频率(LSF)作为训练序列无监督训练SAE,然后使用SAE的输出有监督训练Softmax分类器,最后有监督微调整个网络得到最终网络参数。实验结果表明,在不同背景噪声及不同信噪比下,本文提出算法的分类准确率均优于传统算法,且信噪比越低,性能优势