论文部分内容阅读
本文介绍了两种对广播语料进行语音和音乐分割的建模策略基于GMM的竞争建模策略和区别性建模策略──的实现,这两种策略的建模都采用了MFCC系数作为输入信号的特征参数。通过对实际新闻广播语料的测试,表明这两种策略都能建立起有效地分割语音段和音乐段的分类模型;对于背景音乐和噪音较大的新闻语料,按照竞争建模策略构造的分类模型具有较好的语音/音乐分割性能。文章同时对不同的特征向量构造做了研究,实验表明12维的MFCC参数及其一阶差分、二阶差分能使按两种不同策略建立起来的分类模型都达到最好的语音/音乐分割效果。