基于分数规整的发音方式鲁棒的说话人识别研究

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:kobe7751790
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数域提出了一系列发音方式分数规整(S-Norm)的解决方法。实验结果表明,SZ-Norm、ST-Norm及SZT-Norm的做法均使系统的整体性能在基线基础上有了明显提高,尤其是在SZT-Norm的情况下等错误率下降约为26[%],这说明基于分数规整的方法是有效的。
其他文献
本文利用计算语言学的统计方法对仓央嘉措的124首情歌进行了节律方面的研究。建立了藏汉对照语诗歌节奏类型库,得出了8种主要的诗句词汇组合类型,并对每一种类型在诗歌中出现的
本文阐释玛曲元音央化现象,央化包括高元音[i]、[u]向低央元音[e]的演化,低元音[e]与拉萨话及标杆元音[a]相比来说,是一种央化现象,其开口度较低,舌位靠后。文章主要采用共振峰模
在计算机辅助语言学习系统中,不同音素间的声学混淆现象严重影响发音质量评估的准确性。特别是对少数民族地区学习者来说,地方口音更会加剧这种声学混淆的严重性。为解决这一难
会议
文章主要探讨一种操作性较强的、面向CTTS应用的语句韵律词及韵律短语预测系统,这一系统预测韵律结构只依赖语句的词类音节数序列等简单的文本信息。文章区分了现代汉语中韵律
本文提出一种用于HMM参数化语音合成的针对清浊音优化的基频建模和预测方法。在参数化合成方法中,清浊音预测直接决定激励源的选择,对合成质量有关键影响。针对这一问题,该方法
会议
本文提出了一种新的、基于拼接语音合成系统的韵律自适应模型。该模型能够利用目标说话人少量的语料使语音合成系统合成具有目标说话人韵律特征的语音。同基于平行语料的韵律
语音的韵律特征对情感表达起着非常重要的作用。在基于韵律修改的情感语音转换系统中,为了更为准确地预测情感语音的韵律特征,该文提出一种层次化的韵律分析与建模方法,针对愤怒、高兴、悲伤、惊奇这4种情感对语音按照韵律结构的层级进行分析,探讨不同层次之间情感韵律特征变化规律的关联性和叠加性,并使用高层音段信息作为输入对低层信息进行决策树建模。实验结果表明,本方法对情感韵律特征的预测均方误差比局部分音段以及传
会议
意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为"种子"进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取
会议
人在说话的时候有各种各样的发音方式,如不同的语言;带情感的发音;快速与慢速、大声与小声等等。如果不做任何处理,直接用传统的说话人识别方法来处理,结果会比较差。因此,本论文研
会议
中国地域辽阔,汉语包括多种方言。方言转换技术可实现方言间语音的转换,丰富语音交流的方式,增强语音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调
会议