论文部分内容阅读
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻说话人基频差异大的说话人改变检测出来;第2步采用基于性别的改进T2判决公式进行SS,实现相邻说话人基频差异小的同性别SS,为此,该文提出了一个基于块的潜在说话人改变点检测算法。实验结果表明,本文算法提高了分割准确率,F1度量值可达85.14%。对于短时长(<2s)语音段的