论文部分内容阅读
本文的几个研究方面包括语音库的建设、文本标准化、拼音标注、停顿指数标注、重音判别。都是围绕着将文本向语音的中间过渡阶段的转化这个主题以及为转化提供相应的资源进行的。 首先是语音库的建设,从文本的选择、录音的控制、人工加工等方面进行了详细的科学的设计与实现,为本文中各个研究课题提供了赖以训练测试的数据资源;然后文本标准化规范了输入的文本,对于能发音的特殊符号将其转化为汉字;接下来拼音标注则是告诉了系统该发什么音;最后停顿指数和重音的标注是提高合成语音的可懂度、自然度和表现力的关键,两个符号韵律参数是否会影响到情感的表达?针对情感韵律标注是否需要建立专门的模型?本文对这些问题也进行了专门的研究和讨论。尚未认识清楚的课题,如重音,我们不只是研究应用到TTS系统平台中的自动判别,更是利用现有的语料库对于重音的分类、重音的声学表现、重音和其他语言学现象,如上声的联系等进行研究,试图为学术界早日发现重音现象的奥妙做出应有的贡献,此外针对重音标注语料库构建的困难的问题,尝试为自动实现语料库的扩充进行了一些研究。