论文部分内容阅读
计算机科学的发展使语音技术得到了广泛的发展和应用,基于语音识别的计算机辅助发音学习系统,能够替代教师即时对学习者的发音进行反馈,使语音学习更加高效。开发发音教学系统的语音识别器需要用到大量的错音,但由于错音种类相对较多、采集具有不确定性,且针对不同背景学习者的发音学习系统需要不同的错音模型库,使得错音语料的来源问题成为制约基于语音识别的发音学习系统发展的瓶颈。
本文为了寻求更为便捷的错音获取方法,在共振峰合成器的基础上进行改进,提出一种错音语料自动合成的方法,利用现有大量的正确音得到大量错音语料。本文分别针对元音、擦音和鼻音进行实验,以粤语背景发音人说普通话为例,研究不同类音素的错音合成方法,总结出元音、擦音、前后鼻音错音合成方法。为了验证合成音的效果,本文还针对合成音进行识别实验,实验结果表明,在错音语料足够多的情况下,对于元音和擦音,合成语料训练的错音模型识别效果与录音语料相当。对于鼻音,由合成的后鼻音训练的模型效果也可以替代录音语料。
最后,本文还依据算法方案建立了自动错音合成示范系统。