基于分数规整的发音方式鲁棒的说话人识别研究

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户：kobe7751790

【摘要】

：

实际环境下，一个说话人识别系统的性能受到很多因素的影响，说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化

【作者】

：

王琳琳张利鹏徐明星

【机构】

：

清华大学计算机科学与技术系

【出处】

：

第十届全国人机语音通讯学术会议

【发表日期】

：

2009年期

【关键词】

：

分数域发音方式方式变化说话人识别系统整体性能实际环境解决方法数据库多因素错误率语音训练实验匹配基线

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

实际环境下，一个说话人识别系统的性能受到很多因素的影响，说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础，对于不限定发音方式变化类型的情形，在分数域提出了一系列发音方式分数规整(S-Norm)的解决方法。实验结果表明，SZ-Norm、ST-Norm及SZT-Norm的做法均使系统的整体性能在基线基础上有了明显提高，尤其是在SZT-Norm的情况下等错误率下降约为26[％]，这说明基于分数规整的方法是有效的。

其他文献

仓央嘉措情歌的词汇组合与节律的关系研究

本文利用计算语言学的统计方法对仓央嘉措的124首情歌进行了节律方面的研究。建立了藏汉对照语诗歌节奏类型库，得出了8种主要的诗句词汇组合类型，并对每一种类型在诗歌中出现的

会议

仓央嘉措情歌词汇组合节律计算语言学组合类型韵律节奏统计分析统计方法诗歌节奏类型库诗句民歌藏汉

藏语玛曲话元音央化分析

本文阐释玛曲元音央化现象，央化包括高元音[i]、[u]向低央元音[e]的演化，低元音[e]与拉萨话及标杆元音[a]相比来说，是一种央化现象，其开口度较低，舌位靠后。文章主要采用共振峰模

会议

藏语高元音模式比较开口度共振峰单元音演化声带裂化拉萨阐释标杆

针对少数民族的汉语发音质量评估系统研究

在计算机辅助语言学习系统中，不同音素间的声学混淆现象严重影响发音质量评估的准确性。特别是对少数民族地区学习者来说，地方口音更会加剧这种声学混淆的严重性。为解决这一难

会议

基于词类序列的语句韵律结构预测

文章主要探讨一种操作性较强的、面向CTTS应用的语句韵律词及韵律短语预测系统，这一系统预测韵律结构只依赖语句的词类音节数序列等简单的文本信息。文章区分了现代汉语中韵律

会议

词类序列韵律短语预测韵律结构预测系统对应关系正确率韵律词语法结构文本信息系统预测深度挖掘音节数功能词语料介词汉语测试

HMM语音合成中基频清浊音优化算法研究

本文提出一种用于HMM参数化语音合成的针对清浊音优化的基频建模和预测方法。在参数化合成方法中，清浊音预测直接决定激励源的选择，对合成质量有关键影响。针对这一问题，该方法

会议

拼接语音合成系统中的韵律自适应研究

本文提出了一种新的、基于拼接语音合成系统的韵律自适应模型。该模型能够利用目标说话人少量的语料使语音合成系统合成具有目标说话人韵律特征的语音。同基于平行语料的韵律

会议

拼接语音合成系统韵律生成模型自适应模型预测树样本库转换方法韵律特征韵律模型韵律表现平行语料系统合成证明实验分组

面向情感转换的层次化韵律分析与建模

语音的韵律特征对情感表达起着非常重要的作用。在基于韵律修改的情感语音转换系统中,为了更为准确地预测情感语音的韵律特征,该文提出一种层次化的韵律分析与建模方法,针对愤怒、高兴、悲伤、惊奇这4种情感对语音按照韵律结构的层级进行分析,探讨不同层次之间情感韵律特征变化规律的关联性和叠加性,并使用高层音段信息作为输入对低层信息进行决策树建模。实验结果表明,本方法对情感韵律特征的预测均方误差比局部分音段以及传

会议

基于泛化和繁殖的自举式意见目标抽取方法

意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为"种子"进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取

会议

多发音方式下的说话人识别研究

人在说话的时候有各种各样的发音方式，如不同的语言；带情感的发音；快速与慢速、大声与小声等等。如果不做任何处理，直接用传统的说话人识别方法来处理，结果会比较差。因此，本论文研

会议

汉语普通话与沈阳方言转换的研究

中国地域辽阔，汉语包括多种方言。方言转换技术可实现方言间语音的转换，丰富语音交流的方式，增强语音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调

会议

基于分数规整的发音方式鲁棒的说话人识别研究

与本文相关的学术论文