低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：zhennanquming

【摘要】

：

为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,

【作者】

：

钱彦旻刘加

【机构】

：

清华大学电子工程系,清华信息科学与技术国家实验室,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2013年07期

【关键词】

：

语音识别数据选择声学建模无监督监督训练低数据资源系统性能三音后验概率语音数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。 In order to overcome the shortage of resources under the condition of low data resources, this paper uses unsupervised acoustic model training methods to increase training data and improve system performance. Under the standard unsupervised training framework, based on the word confidence of the posteriori probability of the traditional word graph, the criteria of confidence data screening based on the posterior probability of the sentence is proposed. The selected data is very reliable Good preserving of contextual information facilitates the modeling of transliteration of triphone acoustic models. A method of data screening based on phoneme coverage criteria is also proposed. While considering the confidence of sentence assignment, Sparse phonetic units, again from the source to overcome the difficulties of low data resources, data selection more efficient and further improve performance. Experiments show that the word-error rate based on the improved unsupervised training method is about 8% lower than that of the baseline supervised training method and an absolute 2% reduction from the traditional unsupervised method, which greatly improves the low data resource conditions Under the system performance.

其他文献

全盲、半盲和假盲

坦诚地说，如果让我做个残疾人，我最不愿意做盲人，宁可缺胳膊断腿。为何？因为盲人看不见一切，感受不到五彩缤纷的世界。　　读中学的时候，男生都淘气，有一天看见有位盲人从远处走来，我的同学姜瓜诡秘地说：我做给你们看，保证好白相。他立刻从花坛里捡了一根树枝，迎面朝着盲人走去。当他的树枝打到盲人的腿时，盲人发火了：侬哪能走路？　　姜瓜先发制人：赤那，你走路不看看？我是瞎子，侬也是瞎子啊？　　那盲人顿时笑了：

期刊

一个小编剧的动漫节手记

创意是剧本的生命,中国动漫最缺少的就是创意.创意的缺乏,思想的贫瘠,是一个民族,一个国家,一个产业最深切的痛.

期刊

毕业生动画学院动画片新闻报道产业创意观众国产文学作品

人鬼情未了

中外人鬼情，不同有多处。关于“西方人墓园往往也是乐园”的话题，此前的习作中已经提到，牛津人鬼相安、生死无界的现象比比皆是。死亡的情境中外有很大差异：英国人觉得人的离世是升天，是去了鸟语花香的天堂、极乐世界。汉语里虽然有时也用“归天”来隐喻去世，但绝大多数中国人还是觉得离世是“入土”，认为人活着呆在阳界，死后去了阴间。阳界温暖、光明、充满生机，阴间则阴暗、冷湿、鬼魅横行，处处是触目惊心的惨状和夺人魂

期刊

替米沙坦联合辛伐他汀治疗慢性充血性心力衰竭的疗效

目的:观察替米沙坦联合辛伐他汀治疗慢性充血性心力衰竭(CHF)的疗效。方法:将132例CHF患者随机分为替米沙坦联合辛伐他汀治疗组(联合治疗组,44例)、辛伐他汀组(44例)和常规对

期刊

心力衰竭充血性替米沙坦辛伐他汀心功能

极品女人的魔法书

《好女人是所学校??解读中国当代名媛》教会我们经营自己的精彩生活,可谓是极品女人的魔法书,让我们与极品女人的距离从天涯变为咫尺.想法决定活法,当我们从书中学到名媛的观

期刊

学校中国当代精彩生活魔法解读智慧女性主义研究女性观极品

出版业的真正问题是阅读问题

图书业作为一个市场化的产业,必须依赖于供求关系,所有的供求关系都是建立在一个基本的前提上:必须有人需要.对于图书业来说,就是必

期刊

正问题图书业市场化出版业供求关系基本的读者阅读问题

以把握市场热点来服务读者-试议养生类畅销书的出版

提高市场敏锐度,调查、研究和把握当下的时代热点,有所为有所不为,结合自身的优势就能做好本版畅销书.

期刊

市场养生洪昭光防治指南敏锐度广东教育热点出版教育畅销书有所为有所不为

交感神经型颈椎病误诊30例分析

交感神经型颈椎病是颈椎病分型中最少见的一种类型，多为中老年人，其临床表现缺乏特征性，易被忽略而造成误诊。我院1995～2000年误诊30例，现报道如下。rn1 临床资料rn 本组男21例，女9

期刊

颈椎病/诊断交感神经型误诊

内皮素受体拮抗剂GF-063和BQ-485对低氧培养大鼠肺动脉平滑肌细胞增殖的影响

目的：探讨新型内皮素受体拈抗剂GF-063和BQ-485对低氧培养的大鼠肺动脉平滑肌细胞（PASMCs）增殖的影响。方法：贴壁原代培养PASMCs。实验分为4组：常氧组（氧浓度210ml／L）、低氧组（氧浓度2

期刊

内皮素受体桔抗剂低氧肺动脉平滑肌细胞增殖

具有多值约束的广义左线性递归查询的有效计算

Ullman及Naughton等提出的左线性变换是一种类似于魔集变换的规则改写算法。由于左线性递归是实践中最常见的递归类型之一,并且变换后的规则的自底向上处理相当有效,因此左

期刊

递归查询演绎数据库广义左线性递归魔集内涵数据库自底向上查询优化递归程序子目标斯坦福

低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模

与本文相关的学术论文