基于GMM-UBM模型的语种识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:mmx1019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种识别(Language Identification)是计算机通过分析处理一段语音以判别其所属语种的过程,该技术是近年来语音识别领域的一个新的研究热点,它在多语种信息检索和查询,机器翻译和多语种语音识别的前端处理,以及军事领域中扮演着很重要的角色。并行音素识别结合语言模型(PPR-LM)是最经典的语种识别方法。然而,训练音素识别器时,需要大量人工标注好的音素语料,因而PPR-LM系统的移植性较差。基于GMM的语种识别系统,不需要人工标注语料,具有良好的移植性,特别适合于中国少数民族语的语种识别。论文主要研究与文本无关的语种识别方法,利用通用背景高斯混合模型(GMM-UBM)、语言模型、非监督模型和得分自适应方法建立语种识别系统,以探索提高识别率的途径。论文的主要工作包括:(1)构建一个面向少数民族语种识别的电话语音数据库,该数据库包括8种少数民族语和汉语普通话,每个发音人将有一段谈话录音和20句时间不等的自动问答录音;除汉语发音人外,每个民族语发音人分别用本民族语和汉语普通话完成谈话录音和自动问答录音。(2)利用PPR-LM语种识别原理,构建了一个新的GMM-UBM-LM语种识别系统。该系统充分利用了语言底层的声学信息和音位结构分布信息。以5种语言的电话语音为实验数据,分别设计并实现了三种实验:(a)基本GMM-UBM语种识别实验;(b)采用声学得分和语言模型得分直接相加的GMM-UBM-LM语种识别实验; (c)利用LDA技术实现后端分类的GMM-UBM-LM语种识别实验。(3)在基本的GMM-UBM语种识别系统的基础上,引入非监督得分规整自适应技术,构建新的语种识别系统,以减小同一语种的不一致性,扩大不同语种识别之间的不一致性。设计并完成该语种识别系统的实验,给出详细的实验对比以及讨论。实验结果表明:论文设计的基于GMM-UBM、语言模型(LM)和非监督得分规整的语种识别系统具有较好的扩展性和应用性。利用LDA技术实现后端分类的GMM-UBM-LM语种识别实验,识别率提高10%,但系统的语言模型(LM)训练时间较长和实时性较差;非监督得分规整的语种识识别率提高11%,系统的实时性较好。如果有足够的测试语料,该方案将会获得更好的识别效果。
其他文献
本文通过对荣华二采区10
期刊
压缩感知技术作为一种新型信号处理技术,其能够在极低的采样频率下进行高精度采样,降低了对采样设备的需求。压缩感知技术主要包括稀疏表示、观测矩阵以及重构算法等。其中重构
在高度信息化的现代社会,网络已经成为人们生活中不可缺少的部分。网络的高速发展,不仅使人们可以获得大量的信息,而且它的灵活性进一步推动了网络在各种平台上的应用。数字
感应同步器是一种基于电磁感应原理的位置检测元件,用来构成角度和位移的精密测量、定位和随动系统。由于感应同步器精度高、工作稳定可靠、对安装、外部环境等要求不高等特
采用土培桶栽控水方法,研究了乌兰察布生态型华北驼绒藜(Ceratoides arborescens Ecotype Wu)和科尔沁生态型华北驼绒藜(C. arborescens Ecotype Kerqin)对水分胁迫的生长生理
70年代以来国外研制成功了电荷耦合器件(CCD),随之生产和发展了用CCD作为光敏传感器的数字相机。进入90年代中期,CCD技术成功应用到X射线成像领域(X射线CCD),如医学成像、安
学位
通过电纺丝方法制备的纳/微米级超细纤维材料是近年来广受关注的一类组织工程支架构建材料。在各类电纺材料中,生物可降解的合成聚-羟基酸酯类材料,尤其是乳酸-乙醇酸共聚物(PLG
本文对被子植物基部类群三白草和细辛开花相关基因的克隆,功能与进化进行了研究。文章通过对从细辛和三白草中分离出来的MADS-box转录因子进行进化分析,表明从细辛中分离的MADS
背景和目的 最近,一些有关胰腺囊性肿瘤(pancreatic cystic neoplasms,PCNs)治疗的指南建议已经发表,但是超声内镜(endoscopic ultrasound,EUS)引导下PCNs消融的作用在这些指
对于靶场动态测试,基于图像的零飞测试系统起到非常重要的作用。这种零飞测试方法,可以大大节约测试成本,有效地完成对武器系统动态性能的评测。在实际的零飞测试过程中,复杂