多语种语音合成的韵律建模

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:dragon1788
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文主要研究了中英文混读的韵律建模。汉语属于有调语言,韵律模型要专门针对调形进行描述;英语是无调语言,模型主要对英文重音Accent进行描述。通过设计一个中英文混读的实验,研究表明,汉语说话人的混读朗读中英文受中文的影响明显,音高上升、下倾变陡;而中文受英文的影响比较小。以SFC分层叠加模型为框架,设计中英文混读具有相同的句子和短语层,而有不同的音节层。对各自的音节层可以分别建模,再考虑相互作用下的拼接。这样中英文的韵律就被有机结合起来,实现混读下的整体韵律建模。利用这种框架理念,还可以扩展模型,用于表现多说话人、多语气、多情感等表现力丰富的语音韵律;设计了一个公共的韵律评测体系,并结合已完成的混读韵律模型实现一个基于HMM的Trainable混读合成系统,实现多韵律模型的主观和客观评测。   
其他文献
普通话是现代汉语的标准语,在我国这样一个多民族、多语言的国家大力推广普通话具有重要意义。因此,对某些像教师、公务员等公职人员进行普通话测试是很有必要的。目前,普通
本文首先介绍了专用集成电路的发展及其设计流程,并简单描述了逻辑综合技术的应用和步骤及RFID系统。  RFID是英文“RadioFrequencyIdentification”的缩写,中文称为无线射频
现在对Femtocell的研究越来越多,它主要是作为无线通信中室内信号覆盖弱的一个解决方案。Femtocell基站发射功率更低、无线接入点更小、更便宜,且主要由用户自行安装在家中,然后
信息隐藏技术是一门新兴的交叉性学科,它打破了传统密码学的思维范畴,从一个全新的视角审视信息安全,是信息安全领域的一个新方向,信息隐藏技术在保密通信特别是网络中保护信
  本文介绍了数据链通信是美军C4ISR(指挥、控制、通信、计算机、情报、监视与侦察)系统的主要通信传输方式,通过数据链组网,从而沟通各平台之间的信息流,实现多平台的火力协
蓝牙技术是以替代电缆为最初目的而被提出的一种短距离无线通信技术,是构成无线个人区域网(wPAN)的主流技术。蓝牙特别兴趣小组(SIG)负责制定蓝牙技术的各层通信协议。与无线
随着互联网技术的发展,如视频会议这样的多媒体业务得到了越来越多的应用。传统IP网络需要对业务提供QoS保障。在满足QoS的条件下,寻找将分组发送到一个目的节点的路径的过程称
  近年来,项目反应理论(IRT)是心理与教育测量非常活跃的研究领域,并正迅速成为主要的测量理论之一。项目反应理论是在批评经典测量理论(CTT)的局限性的基础上发展起来的,随着
EDA技术是电子设计领域的一场革命,目前正处于高速发展阶段。广泛使用PLD器件是提高电子产品性能和竞争能力的主要技术措施之一,应当大力普及推广。因此,本文以可编程逻辑器
多小区协作通信技术是指多个基站通过回传链路彼此共享用户信息从而进行协同传输,因为回传链路带宽是有限的,可以只在基站间交换用户信道状态信息,分析证明这种协作通信技术在