论文部分内容阅读
本文利用朗读语科库ASCCD,深入分析了汉语普通话韵律特征的声学表现,提出了针对普通话的韵律边界、重音的自动检测模型。用实验研究方法实现了从普通的语音到带有韵律结构特征的结构化语音的跨越。根据说话人特点的不同,研究了应用极大后验概率MAP算法的说话人自适应方法,分析了韵律结构与句法结构的部分相关关系,以及语法分词对韵律边界自动检测的贡献。本研究主要内容如下:
⑴研究了普通话朗读语音的韵律结构的声学表现特征,统计分析了部分特征的数值分布。进一步从语料库统计分析角度验证了有关韵律的研究结果:音高下倾、音高重置、音高低线的边界提示功能和音高高线的重音提示功能等等。
⑵通过构造合理的声学特征,提出了一种基于CART决策树的韵律边界自动检测模型,该模型不仅能有效地对韵律边界进行自动识别,而且还能够得到各类声学特征的贡献大小。
⑶在CART决策树自动检测模型基础上,依据韵律特征局部比较特性,进一步提出了分层解析的自动检测模型,较大地提高了韵律边界自动检测准确性。同时也提出了结合GMM的韵律边界自动检测模型。
⑷应用CART决策树建立了重音级别的自动检测模型,同时也提出了基于概率混合模型的重音自动检测模型。
⑸研究了应用极大后验概率MAP算法的说话人自适应方法。提高了韵律边界和重音级别检测模型的鲁棒性。
⑹研究了句法结构和韵律结构的比较关系,并尝试结合语法分词信息的韵律边界自动检测模型。