论文部分内容阅读
中国是一个地域辽阔,方言语言丰富的国家。随着语音合成技术的发展,已有研究学者对方言语音的合成展开研究。中国方言与普通话之间除了发音及声调差异外,还存在特殊词汇的差异。针对此特点,本论文以邢台方言为研究对象,对比了普通话与邢台方言的发音差异,提出一种邢台方言和普通话混合语言的文本分析方法,将普通话的词汇转换为邢台方言的特殊词汇,获得语音合成所需的上下文相关的标注文本。在此基础上,利用基于隐Markov模型(Hidden Markov Model,HMM)的统计参数语音合成方法,采用说话人自适应训练(Speaker Adaptive Training,SAT)和说话人自适应变换技术,合成出邢台方言或普通话的语音。论文的主要工作和创新如下:1.设计了一套邢台方言和普通话通用的机读音标方案和特殊词汇替换词典。通过对比普通话与邢台方言在声韵母和声调上的差异,设计了一套用来标注普通话发音和邢台方言发音的标注方案SAMPA-XT(Speech Assessment Methods Phonetic Alphabet for Xing Tai),能够将输入的文本转换为相应的读音。同时,根据文白异读词汇上的发音差异,设计了一个普通话词汇到邢台方言词汇转换的方言词汇词典,用于将输入本文中的普通话词汇替换为邢台方言词汇。2.建立了一个面向语音合成的邢台方言/普通话的双语语料库。根据邢台方言的发音特点,设计了300句邢台方言的文本语料,覆盖邢台方言声韵母、声调以及常用文白异读词汇的发音特点。根据文本语料,分别录制了普通话方言的语音语料。3.实现了邢台方言的文本分析,能够将输入的文本转换为语音合成所需的上下文相关的标注文本。首先将输入文本转换成普通话拼音,再利用方言的变音规则和特殊词汇词典获得文本的方言声韵母读音,并用SMPA-XT表示。同时利用文本分析获得的声韵母信息、词信息、韵律结构信息和语句信息,产生用于语音合成的上下文相关的标注。4.实现了普通话与邢台方言的跨语言语音合成。利用多个说话人的普通话语音和少量的邢台方言训练语音,在基于HMM的统计参数语音合成的训练中引入说话人自适应训练和说话人自适应变换,获得邢台方言或普通话的声学模型,从而合成出普通话语音或邢台方言语音。主观评测结果表明,在方言语料训练集较少的情况下,本文提出的方法合成的邢台方言语音的音质优于传统方法。