语音识别中的后处理技术研究

来源 :北京邮电大学 | 被引量 : 16次 | 上传用户：ASINLU

【摘要】

：

普通话大词汇量连续语音识别的研究已经进行了十多年,虽已取得了显著进展,但距离广泛应用还有相当的距离。语音识别后处理是将前处理所得到的音节流转换为汉字流的过程。研究

【作者】

：

吴斌

【出处】

：

北京邮电大学

【发表日期】

：

2008年01期

【关键词】

：

后处理解码最小贝叶斯风险准则区分性语言模型错误检测错误纠正

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

普通话大词汇量连续语音识别的研究已经进行了十多年,虽已取得了显著进展,但距离广泛应用还有相当的距离。语音识别后处理是将前处理所得到的音节流转换为汉字流的过程。研究发现,语音识别系统的后处理对提高系统性能具有十分重要的意义。人类听觉实验表明,人只能听清连续语音流中70%的音节,剩余的30%是靠上下文知识来猜测理解的。因此,语音识别后处理受到了广泛的关注,得到了越来越深入的研究。本文主要对普通话大词汇量连续语音识别后处理中的语言模型自适应、解码策略、错误处理等问题进行了研究,主要工作与创新包括以下几个方面:1.汉语混淆网络算法首先研究了最小贝叶斯风险解码准则以及基于最小贝叶斯解码准则进行最小字错误率解码的若干方法,例如:基于N-best lists的方法、基于word lattice的方法等。在此基础上,考虑到汉语语言的特点,提出一种构造汉语词混淆网络的算法,对于汉语词格(wordlattice)中的长弧,在强制对齐时根据其发音特点快速有效地加入null弧。实验表明改进的构造汉语词混淆网络进行解码的方法与MAP(Maximum a posterior)解码、先前的各种错误率最小化算法相比,有效地降低了普通话大词汇量连续语音识别词错误率。汉语中一个词一般由1—4个汉字组成,由不同数目汉字组成的词的发音时间长短差别比较大,造成构造的汉语词混淆网络中包含了大量的null弧。本文提出一种构造汉字混淆网络来获取具有最小字错误率的识别结果假设的方法,这种算法显著地减少了构造的汉字混淆网络中的null弧的数目。实验结果表明这种构造汉字混淆网络进行解码的方法有效降低了识别结果的字错误率。2.解码结果的错误检测与纠正研究在普通话大词汇量连续语音识别中,识别结果出错的现象和原因非常复杂。本文首先分析了一些常见的普通话大词汇量连续语音识别结果中的错误及其出现的原因。在此基础上,采用基于转换的学习方法从混淆网络中学习纠错规则,实验表明应用这些纠错规则能够有效降低识别结果的词错误率。考虑到汉语语言的复杂性以及用于错误纠正规则学习的训练语料集有限,不能覆盖所有的错误现象,本文使用统计的方法进行错误的检测与纠正。具体地,本文提出一种基于支撑向量机SVM(SupportVector Machines)进行错误检测与纠正的框架,首先使用SVM对识别结果假设字串中的每个字进行分类,判断其正确性;接下来对于分类为错误的字基于汉语字混淆网络构造候选字序列,对候选字序列重新打分,选择最高得分的字串作为错误纠正的结果。实验结果表明这种方法能够有效地检测出识别结果中的错误并进行纠正,降低了字错误率。3.语音识别中的区分性语言模型研究语言模型自适应是根据不断变化的应用环境,调整语言模型中各种现象出现的概率,以适应不同应用环境的特征。本文将Boosting、Perceptron以及最小化样本风险三种算法用于训练语音识别系统中的N-Gram语言模型,使其对特定领域具有自适应能力。实验结果表明使用这三种算法训练的N-Gram语言模型降低了特定领域的语音识别结果的词错误率。其中Perceptron算法训练的N-Gram语言模型的领域自适应能力最好。所以本文在通用领域的语音识别中,将输入的语音与识别输出的汉语词混淆网络作为训练样本,使用Perceptron算法训练区分性语言模型,并用这种语言模型对汉语词混淆网络重新打分。实验结果表明这种方法有效地降低了识别结果的词错误率。

其他文献

面向订单生产的作业计划与排程方法研究

本文在总结国内外作业计划与排程问题研究现状的基础上,分别以柔性Job shop生产过程和混流装配线生产过程为研究对象,建立了以生产效率、设备利用率以及交货期满意程度三者综

学位

柔性Job shop混流装配线作业计划与排程遗传粒子群算法

风险投资对创业企业作用的实证研究

文章从风险投资对创业企业作用的机理分析出发,实证研究风险投资对创业企业创生和企业成长的作用。对企业创生作用的研究表明风险投资活动的发展和增长有助于地区新企业的创

期刊

风险投资创业企业企业创生企业成长倾向得分匹配选择作用

对高校体育教学改革现存问题的反思

运用文献综述法阐述了高校体育教学改革所存在的问题,对高校体育教学改革步入发展误区的成因进行解析,并提出相应的解决对策,其目的在于修正改革过程中所存在的弊端,为推进高

期刊

高校体育教学改革现存问题反思

“中信泰富炒汇巨亏”事件始末

<正>2008年"中信泰富炒汇巨亏"事件中,孔丹成功制定"一揽子"方案,带领中信集团走出泥沼,转危为安。这个被孔丹称为"完全可以作为一个处理危机的教材实例",究竟怎样令人心惊动

期刊

中信泰富CEO中信集团

心脏不停跳心内直视手术41例分析

目的探索心脏不停跳心内直视手术中常见困难及应对策略。方法41例体外循环心脏不停跳心内直视手术，同步监测左心室压和主动脉灌注压、有创动脉压、脉搏波形，主动脉根部插槽针排

期刊

心脏外科手术方法气体栓塞手术后并发症

重新鉴定问题研究

重新鉴定本是我国诉讼法确立的一种司法鉴定救济途径,但在司法实践中异化成了无序的重复鉴定,成为司法鉴定运行和改革过程中的顽疾。文章通过剖析"重新鉴定"这一顽疾的病理和

期刊

司法鉴定重新鉴定制度改革

关于判例法几个“优点”的思考

通过对判例法的一致性、灵活性和节约性进行分析,本文旨在说明这些不足以成为判例法独特的优点,成文法亦如此,甚至可以说它们本身就是一种缺陷。在判例法问题上,我们必须保持

期刊

判例法一致性灵活性节约性移植偏好

功能·领导力·角色定位：现代大学与大学校长

在全面建设小康社会,实现"两个一百年"奋斗目标与中华民族伟大复兴中国梦的关键时期,讨论大学校长的领导力与角色定位,应从大学这一古老而常新的机构所承担的核心功能—知识

期刊

现代大学功能领导力大学校长

不同水平网球专项学生发球质量与表面肌电特征研究

网球发球的球速大小和落点准确率高低是网球专项学生发球质量差异的重要体现,发球过程中肌肉表面肌电特征能够直观的呈现各肌肉用力的特点。目的:根据不同水平网球专项学生发球球速、发球落点和各肌肉表面肌电的测量结果,分析不同水平网球专项学生发球球速大小、落点准确率高低和主要用力肌群的表面肌电特征。旨在为网球发球教学训练提供一定的理论依据,助力于普通高校网球专业的课堂教学和技术训练,有利于普通高校体育专业网球

学位

网球专项发球质量发球速度发球落点表面肌电发力贡献

论辩证法和形而上学的根本区别

从与形而上学相对立的角度来看,辩证法指的是思维方式及本体观;形而上学指抽象的思维方式及所得出的事物观,辩证法指的是具体的思维方式及得出的事物观。黑格尔辩证的具体事

期刊

辩证法形而上学抽象具体实在(现实)

语音识别中的后处理技术研究

与本文相关的学术论文