论文部分内容阅读
本研究基于大规模语料库,通过剥离声调等因素对音高的影响,逐步揭露出韵律结构因素对汉语普通话陈述句音高变化的作用。并在研究结论的基础上,通过对大规模语料库进行相关参数的统计建模,使用模型对语句音高进行预测,并将预测结果应用到合成语音,通过MOS评测来验证研究结论的正确性。本文的研究内容主要包括语调和字调两个方面。语调方面,本文将韵律层级结构和声调音域的概念相结合,提出了音域箱及其相关概念。本文通过统计分析考察了音域箱的特点,并根据分析结果建立高音线-低音线预测模型。在已知韵律结构和重音分布的前提下,该模型可以预测普通话陈述句的语调走势。研究表明,在音域父子箱中,(1)子级箱的低线具有阶梯式下行性。(2)子级箱的高线具有S-U(重音-非重音)两级性。重音级高线明显高于非重音级高线。(3)子级箱低线的阶梯式下行性和音域箱的层级嵌套性导致音高重置更可能发生在等级较高的韵律边界处,并且边界等级越高重置幅度越大。字调方面,本文详细分析了各个调类在不同语流环境中的调型,以及前字调类对本调调型的影响,并根据分析结果建立调型预测模型,在已知声调音域和音节类型的前提下,用以预测音节的调型曲线。研究表明,(1)浊音声母和零声母音节的调型受前音节声调类型影响较大,清音声母音节的调型受前音节声调类型影响较小。(2)前音节的调型段末尾如果具有高音特征,那么本音节的基频段起始点音高较高;前音节的调型段末尾如果具有低音特征,那么本音节的基频段起始点音高较低。(3)轻声的性质与其他几个调类不同,它的调型和调值是依赖前音节的声调类型而存在的。最后,本文结合上述两个预测模型,建立了陈述句音高曲线预测模型,在已知句子韵律结构和重音分布的前提下,用以预测普通话陈述句的音高曲线。将预测结果用于语音合成后得到了自然的合成效果,说明本文的研究结果是合理的。