论文部分内容阅读
说话人转换是将源说话人的语音特征转换成目标说话人的特征,使得听起来像是目标说话人的语音.提出的说话人转换系统分为2个部分,第一部分利用高斯混合模型进行谱包络的转换,训练采用时间对齐的源说话人和目标说话人的语音数据进行.第二部分基于一个分类器和残差码本对残差信号预测.该系统在现有的说话人转换系统的基础上做了一些改进,改进后不再需要说话人模仿别人的语调,并且在某些性能上超过了现有的系统.