基于聚类特征联合字典的非负矩阵分解语音转换

来源 :苏州大学 | 被引量 : 1次 | 上传用户:lizdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换即维持语义不变,对源说话人的语音进行转换,使其具有目标说话人的个性特征。语音转换涵盖信号处理、声学等学科,对语音信号转换的探索可促进如:语音编码、说话人识别等的革新。语音转换在文语合成系统、多媒体娱乐、语言翻译系统、医学领域的语音增强系统以及说话人伪装身份通信方面应用广泛。现有的绝大多数算法基于统计模型,其中高斯混合模型是主流。它们中很多需要源和目标说话人的足量平行语料,这带来了很多限制和问题。比如,训练的数据对两个说话人必须是相同的,训练的模型只能被应用到特定的一对组合,说话人的语料不充足,对齐时可能会出现的帧间错误匹配等等。本文在传统的非负矩阵分解语音转换基础上,提出一种利用聚类特征联合字典实现多对多说话人的稀疏非负矩阵分解语音转换算法。它将说话人语音的频谱特征分解成个性特征和语义相关两部分。首先利用语音分析模型自适应加权谱内插(STRAIGHT)提取语音的基频和短时谱参数,对短时谱求解其线性预测倒谱系数(LPCC)。其次,将N个说话人的适量平行语料对齐,通过高维均值聚类得到各自的字典。然后,将非负矩阵频谱参数近似为各自字典的线性组合与激励阵的乘积。转换语音频谱参数是目标语音联合字典与源语音激励阵优化后的组合。该算法可以在源和目标说话人语料不充足的情形下实现多对多的语音转换。实验结果显示,以上方法在VCC2016语料库上实验得到的转换语音的谱失真和语音质量均优于传统的非负矩阵分解。转换语音的平均谱失真度比传统算法降低了大约4.3%。
其他文献
园林博览会这种源自西方的展览形式在中国已经发展了数十年。举办过园博会的城市虽然在展览期间吸引了大量的游客,创造了巨大的经济价值,但是在园博会闭幕后,它们无一例外地
胃癌是世界上最常见的恶性肿瘤之一。在我国,胃癌的死亡率多年来一直居恶性肿瘤的第一位。胃癌发生转移是造成胃癌患者死亡的主要原因。血管生成是恶性肿瘤生长和转移的基础。
事业单位作为我国社会发展中较为重要的企业形式,其发展情况受到了社会各界的广泛关注。本文通过探究新制度对事业单位固定资产计提折旧的影响,以期事业单位可以得到更好的发
在体育项目发展中,后备人才的培养占据着至关重要的地位.因此,在田径运动中,我们不可忽视后备人才的培养.本文通过对广东省青少年田径运动后备人才培养现状的研究,希望能够找
壳体结构因造型美观、受力合理受到建筑设计者的推崇。如何使壳体结构仅受压力或拉力,进而能够使材料得到充分利用一直是研究人员的探索目标。近代以来,学者们对于这一目标提
目的研究女性抑郁症心理应激和防御特征。方法入组87例女性抑郁症患者,进行一般资料调查、生活事件量表(LES)、防御方式问卷(DSQ)、汉密尔顿抑郁量表(HAMD-24)、和汉密尔顿焦
[目的]:建立并鉴定两种不同来源树突状细胞(DC)培养体系,在体外诱导正常人外周血单个核细胞(PBMC)和脐血干细胞生成成熟DC,探讨细胞因子对DC的影响及DC在肿瘤免疫中的作用。[方
住区封闭所造成的城市问题和社会问题正越来越被人们所意识,作为城市发展重要内容的旧城更新正逐步走向开放化和多样化。重视现状资源、强调空间开放和设施共享、尊重自然和
随着社会主义市场经济深入发展和扩大的对外开放及信息社会的到来,思想政治理论课面临许多新问题。根据社会主义市场经济深入发展和对外开放扩大背景下大学生思想政治理论课
本文对高校图书馆纸质图书的采访工作进行了探讨,并以河南工业大学为例,结合本馆实际情况及存在问题,提出了制定采访标准、设立学科馆员等几种可以开发的采访模式,旨在有限经