基于GMM-UBM模型的语种识别

来源 :云南大学 | 被引量 : 0次 | 上传用户：mmx1019

【摘要】

：

语种识别(Language Identification)是计算机通过分析处理一段语音以判别其所属语种的过程,该技术是近年来语音识别领域的一个新的研究热点,它在多语种信息检索和查询,机器翻

【作者】

：

徐永华

【机构】

：

云南大学

【出处】

：

云南大学

【发表日期】

：

2010年期

【关键词】

：

语种识别高斯混合模型背景模型语言模型判决层融合非监督的自适应得分规整

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语种识别(Language Identification)是计算机通过分析处理一段语音以判别其所属语种的过程,该技术是近年来语音识别领域的一个新的研究热点,它在多语种信息检索和查询,机器翻译和多语种语音识别的前端处理,以及军事领域中扮演着很重要的角色。并行音素识别结合语言模型(PPR-LM)是最经典的语种识别方法。然而,训练音素识别器时,需要大量人工标注好的音素语料,因而PPR-LM系统的移植性较差。基于GMM的语种识别系统,不需要人工标注语料,具有良好的移植性,特别适合于中国少数民族语的语种识别。论文主要研究与文本无关的语种识别方法,利用通用背景高斯混合模型(GMM-UBM)、语言模型、非监督模型和得分自适应方法建立语种识别系统,以探索提高识别率的途径。论文的主要工作包括:(1)构建一个面向少数民族语种识别的电话语音数据库,该数据库包括8种少数民族语和汉语普通话,每个发音人将有一段谈话录音和20句时间不等的自动问答录音;除汉语发音人外,每个民族语发音人分别用本民族语和汉语普通话完成谈话录音和自动问答录音。(2)利用PPR-LM语种识别原理,构建了一个新的GMM-UBM-LM语种识别系统。该系统充分利用了语言底层的声学信息和音位结构分布信息。以5种语言的电话语音为实验数据,分别设计并实现了三种实验:(a)基本GMM-UBM语种识别实验;(b)采用声学得分和语言模型得分直接相加的GMM-UBM-LM语种识别实验; (c)利用LDA技术实现后端分类的GMM-UBM-LM语种识别实验。(3)在基本的GMM-UBM语种识别系统的基础上,引入非监督得分规整自适应技术,构建新的语种识别系统,以减小同一语种的不一致性,扩大不同语种识别之间的不一致性。设计并完成该语种识别系统的实验,给出详细的实验对比以及讨论。实验结果表明:论文设计的基于GMM-UBM、语言模型(LM)和非监督得分规整的语种识别系统具有较好的扩展性和应用性。利用LDA技术实现后端分类的GMM-UBM-LM语种识别实验,识别率提高10%,但系统的语言模型(LM)训练时间较长和实时性较差;非监督得分规整的语种识识别率提高11%,系统的实时性较好。如果有足够的测试语料,该方案将会获得更好的识别效果。

其他文献

泛在电力物联网引领未来

本文通过对荣华二采区10

期刊

网络化音频处理器的设计与实现

在高度信息化的现代社会,网络已经成为人们生活中不可缺少的部分。网络的高速发展,不仅使人们可以获得大量的信息,而且它的灵活性进一步推动了网络在各种平台上的应用。数字

学位

网络化音频处理器DSP驱动LwIP均衡

华北驼绒藜两种生态型对水分胁迫的响应

采用土培桶栽控水方法，研究了乌兰察布生态型华北驼绒藜(Ceratoides arborescens Ecotype Wu)和科尔沁生态型华北驼绒藜(C. arborescens Ecotype Kerqin)对水分胁迫的生长生理

学位

华北驼绒藜水分胁迫抗旱性生理生态

赖氨酸对电纺PLGA超细纤维降解的pH调控及生物相容性研究

通过电纺丝方法制备的纳/微米级超细纤维材料是近年来广受关注的一类组织工程支架构建材料。在各类电纺材料中，生物可降解的合成聚-羟基酸酯类材料，尤其是乳酸-乙醇酸共聚物（PLG

学位

电纺丝乳酸-乙醇酸共聚物赖氨酸pH调控生物相容性

被子植物基部类群三白草和细辛开花相关基因的克隆，功能与进化的研究

本文对被子植物基部类群三白草和细辛开花相关基因的克隆，功能与进化进行了研究。文章通过对从细辛和三白草中分离出来的MADS-box转录因子进行进化分析，表明从细辛中分离的MADS

学位

被子植物植物发育基因克隆

基于图像的零飞测试系统的研究

对于靶场动态测试,基于图像的零飞测试系统起到非常重要的作用。这种零飞测试方法,可以大大节约测试成本,有效地完成对武器系统动态性能的评测。在实际的零飞测试过程中,复杂

学位

零飞仪粒子滤波图像跟踪动态检测

基于GMM-UBM模型的语种识别

其他学术论文