多参数驱动的年龄语音转换系统

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:owen_climb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指在不改变源说话人语音的语义的情况下,通过改变其语音的个性特征,使转换后的语音具有目标说话人的个性特征,从而使得转换后的语音听起来与目标说话人的语音很像。年龄语音转换是语音转换中的一种,是指改变说话人语音的年龄信息,使之听起来像该说话人目标年龄时的语音。本文重点研究基于说话人语音特征的个性化年龄语音转换问题,实际构建了由说话人语音特征参数驱动的年龄语音转换系统。论文的主要工作和创新点如下:(1)利用从互联网上搜集到的一位男性和一位女性在不同年龄段录制的语料,建立了一个小型的年龄语音数据库。其中,男性语料共176句,涵盖了该男性12岁、18岁和23岁三个年龄段的录制语音;女性语音资料共85句,包括该女性在12岁和20岁两个年龄段录制的语音。每句语音的长度在5-10s之间。(2)针对基于线性预测编码(LPC)的语音共振峰提取算法不能很好处理合并峰和虚假峰,导致所提取的共振峰频率欠准确的问题,提出了一种改进的极点交叉线性预测算法。这个算法是通过修改共振峰极点半径,达到减小由极点交叉引起的误差,从而提高共振峰频率估计的准确度的目的。(3)众所周知,声道长度的不同是导致同一说话人不同年龄段的语音听起来存在差异的一个重要因素。为了保证测试语音经年龄语音转换后的输出与目标年龄段的语音听起来很像,声道长度对齐是必不可少的技术。本文分析研究了声道长度对齐技术中的频率转换因子估计和频率弯折函数选取两个核心问题,构建了用于年龄语音转换目的的频谱转换模型。在此基础上,建立了多参数驱动的年龄语音转换系统,取得了较好的个性化特征保持的年龄语音转换效果。
其他文献
期刊
近几年来,软开关电路系统非线性建模及动力学行为研究已逐渐成为电力电子领域研究的热点。因为软开关电路系统中的非线性现象研究不仅有助于揭示系统工作不规则现象的成因,保障系统的工作性能稳定,而且还可以促使产生相应的临界点控制方案,提高系统动态响应能力。然而,由于软开关电路系统普遍为高阶、多模态、工作频率负载依赖的系统,使适用于硬开关电路系统的基于固定周期的离散映射建模方法具有相当的局限性。本文主要研究了
期刊
工业控制技术发展至今,许多应用领域对于工业控制系统提出了更高更新的要求,这些应用都存在覆盖范围广、检测点分散或者监控对象处于运动状态中等特点,如何经济有效地实现所需的
期刊
期刊
目前我国经济发展十分快速,各行各业都在十分快速的发展,随着人们生活水平的提高.人们对装饰工程施工的质量要求也越来越高,特别是对住房的内部要求特别高.我国工程中,门窗工
期刊
期刊
以色列这次空前规模的围剿行动被认为是沙龙政府对阿拉法特的最后一战,是其把阿拉法特边缘化政策的继续和升级,意在从心理上压服这名老对手.