多重ANN/HMM混合模型的竞争学习机制研究

来源 :教书育人·高教论坛 | 被引量 : 0次 | 上传用户：frale

【摘要】

：

【作者】

：

史国良梁鹏

【出处】

：

教书育人·高教论坛

【发表日期】

：

2010年12期

【关键词】

：

混合模型竞争学习训练样本集差异性发音人语音识别语音命令实验结果模型应用识别率时段男女理想建模

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　一、引　言
　　
　　我们都知道，语音命令的训练样本之间是存在很大差异的，譬如，男女声发音之间、不同发音人之间、甚至于同一个人在不同时段发音之间，都可能存在较大差异。在差异性较大的训练样本集上，训练的模型很难对所有样本都有好的建模效果。我们将ANN/HMM混合模型应用于语音识别，取得了较好的效果。但从实验结果我们也可以看到这种差异造成的识别率并不理想的情况。
　　由此，我们提出了一种多重ANN/HMM混合模型，为每个待识别命令建立一个多重(多链)的结构，以期能够改善由于样本差异降低识别率的情况。在多重混合模型中，我们将重点讨论如何将多重模型整合到一起，及其竞争学习机制。
　　
　　二、多重ANN，HMM混合模型
　　
　　在多重ANN/HMM混合模型中，每个待识别命令都由多个ANN/HMM来一起为它建模。假设每个模式对应M个ANN/HMM，我们称该模型是M重的，则每个待识别模式的多重ANN/HMM模型结构如下：
　　如图l所示的M重ANN/HMM混合模型，AHi(1≤i≤M)表示M重模型中的第i重，每一重都为ANN/HMM识别模式，在这里我们称它为子识别模式。若待识别模式有K个，可计算得整个识别系统共需要M×K个子识别模式，即M×K个ANN/HMM混合模型。由于每个子识别模式都是一个通过预测网络(PNN)来预测观测概率矩阵的隐马尔可夫链，所以我们也可简称多重混合模型为多链模型。
　　模型建立好之后，在识别的时候，数据特征输入给每一个链，每个链都将得出一个平均误差Ei(i＝1，2，?，M)，各个链通过竞争，将平均误差最小的那个Ei作为该模型的最终结果。
　　即，其中，E为模式最终的平均误差。
　　
　　三、竞争学习机制
　　
　　前面我们已经提到，采用多重ANN/HMM模型的目的是为了区分开差异样本，提高模型的建模精度。下面我们就来介绍一下实现这一目的的原理以及多重ANN/HMM混合模型的训练算法。
　　我们期待建立的多重模型的各个链的作用是互补的。例如，对于待识别命令“放大”，它的第一个链能够对样本中某些发音相近的部分很好的建模，而第二个链则能够对发音相近的另一部分进行很好的建模，以此类推。这样，进来的某一个样本，总可以找到多重模型中的一个链对它的建模效果比较好。这就是“适者生存，优胜劣汰”的道理。下面给出了一个示例图：
　　如上图所示，整个圆代表全部训练样本，假设我们的重数M＝5，则训练的过程是将全部样本按相近性分成五个部分，分别作为5个链的训练样本集，例如图中红色的代号为4的部分代表第4个链的训练样本集。
　　问题是：如果人为来进行分割的话，则缺乏通用性和方便性，同时也可能是不客观的。那么，如何让训练算法自身来解决这个问题呢?
　　于是，我们提出了一种竞争学习方法，该方法的基本思想是：每次将训练样本数送给各个链，经计算各自得出一个平均误差，误差最小的那个链我们认为它在所有链中能够最好地表示该样本，因此，它在竞争中胜出，如图1所示，我们将这个竞争结果反馈回来，最终将这个样本划归给该链。
　　
　　四、竞争学习算法
　　
　　整个多重ANN/HMM混合模型的训练算法如下：
　　1.初始化i＝1；集合S(k)=NULL(k＝1，2，?，M)；初始化5个链的权值矩阵，循环控制变量loop与样本总量F_NUM；
　　2.如果i＞loop，退出算法；否则，j＝l，转步骤3)；
　　3.如果j＞F_NUM，转步骤7)；否则，转步骤4)；
　　4.第j个样本Fj经过AHk(k＝1，2，?，M)，计算出各链的平均误差
　　5.求出平均误差最小的，将巧加入S(k)；
　　6.j加1，转步骤3)；
　　7.用s(k)中的数据采用第二章中的训练算法训练第k个链，其中k从1到M；
　　8.i加1，转步骤21
　　在该算法中，各个链通过自己适应的竞争机制，得到与自己相适应的训练样本子集，而从样本的角度出发，它们也总能找到对自己建模精度最高的那个链，继续训练该链，使其获得更精确的建模效果。
　　
　　五、实　验
　　
　　我们定义了5个待识别语音命令：放大、缩小、全屏、上移、下移。五个女性参与发音，每人为每个命令发音60次，其中，40次作为训练样本，20次作为识别样本。实验所用数据的采样率是16KHz，帧长为25ms，帧移为12，5ms，这里的一帧是指一段语音数据。我们采用的是Mel频率到普系数(MelFre-quency Cepstrum Coefficient一简称MFCC)。
　　方便多重ANN/HMM混合模型同ANN/HMM时序模型的比较，我们选取了同参考文献[1][2]相同的实验数据。只是我们只取MFCC自身的12维特征加上1个短时能量共13维特征，而不再使用一阶、二阶差分，这是由于我们使用的ANN实际上是一种预测网络PNN，这里实现用前两帧数据预测当前帧数据，可以近似的代替一阶、二阶差分。
　　采用上面的实验数据，重数M从1取到5的实验结果见表1和图3。
　　在图3中，当M＝2时，识别率有些微下降，这是由于采用两个链并不能很好地区分开所有样本，而对每个链而言，训练样本数却少了几乎1/2，识别率也就不会太高。系统在M从3到5的识别率是逐步升高的，在M＝5时达到了93.2％。M＞5的实验我们没有做，但可以看见：如果M过大，完全超出样本差异性范畴，也就是样本之间的差异并不需要这么多的子模型去区分，这样M的增加不但无法更好地对待识别对象进行建模，还可能在很大程度上影响建模效果。
　　总体上同参考文献[2]中的实验结果的平均识别率85.8％相比较，竞争学习机制下的多重ANN/HMM混合模型的平均识别率可达到96.4％，有了显著提高。
　　
　　参考文献
　　[1]刘明宇，ANN/HMM混合模型在语音识别中的应用[J]，自动化技术与应用，2009(6)
　　[2]刘明宇ANN/HMM混合模型中状态数的自适应确定方法研究[J]自动化技术与应用，2009(7)

其他文献

试论独立学院人才培养模式创新

一、独立学院人才培养模式现存的问题——创新的必要性　　　　1.办学定位不明确，照搬母体高校培养目标　　独立学院办学历史短，在办学经验、学校管理水平等方面与公办大学存在明显的差距。当前教育界对独立学院人才培养目标的基本共识是培养本科层次的应用型人才。然而这种表述过于笼统，一些独立学院也因缺少深入思考而未赋予其实质性的内容，仍然显得目标不明确。另有一些独立学院对自身在整个高等教育体系中的地位认识不清晰

期刊

独立学院人才培养模式培养目标办学经验应用型人才母体高校基本共识大学存在本科层次办学定位实质性教育界必要性学校问题平等内容历史

高校学生干部角色定位的理论与实践

一、角色追求目标：表现性角色　　　　新世纪以来，高校招生规模都有不同程度的扩大，一校多区的办学模式普遍出现，学校资源的供给与学生需求之间的矛盾长期存在，加上学生自身出现的新情况新问题，使得新形势下做好学生工作比以往显得更加艰难和复杂，作为校园中的一个特殊群体的高校学生干部连接着学校和广大同学，是学校管理系统中不可或缺的重要依靠力量，是学生工作政策的具体贯彻落实者，他们不仅要认真完成学业，还要牺牲大

期刊

高校学生干部角色定位理论学生工作表现性角色学校管理系统好学生追求目标招生规模依靠力量一校多区学校资源学生需求闲暇时间特殊群体工作性

高等师范院校课程内容选择的价值判断标准——以地方师专小学教育专业为例

一rn学校为学生开设什么样的课程,教师在教学过程中选择何种教学内容,犹如餐馆用什么样的饭菜招待顾客.如果饭菜可口,色香味俱全,顾客自然皆大欢喜,以后还会伺机光顾;如果技

期刊

高等师范院校课程内容选择价值判断标准地方师专教学内容专业课程设置自然学生成长小学教育社会发展教学过程顾客色香味学校教师技艺餐馆

多元文化语境下的外语教师自身素质发展

一、引　言　　　　文化这一概念在外语教师素质发展中的作用越来越引起人们的关注，很多学者从社会文化背景这一角度来探究与考察外语教师的素质发展。外语教师的素质发展不再是单一的教授学生外语知识以及自身能力的发展，同时还是教师的“自我理解”，即教师对自身以及教师对其在实践过程中的理解的反思与建构。此外，更加值得注意的是外语教师素质发展的方向、过程以及结果对其所存在的环境尤其是社会文化环境十分依赖。由此，从

期刊

多元文化语境外语教师素质发展社会文化环境社会文化背景反思与建构自我理解自身能力外语知识探究实践意义实践过程理论价值学者学生视域考

关于高等院校计算机基础课的思考

高等教育的首要任务在于培养具有创新精神和实践能力、综合素质好的高级专门人才。高级专门人才的必备条件之一就是具有较好的计算机应用能力。我国高教司明文规定高等学校各专业必修课程需开设计算机基础课程。高等院校计算机基础课程是一门实践性和实用性都很强的课程。其教学内容主要涉及计算机基础性和通用性的概念、技术及应用，通过理论教学和实验教学，培养学生对以计算机技术、多媒体技术、数据库技术和网络技术为核心的信息

期刊

高等院校高级专门人才计算机基础课程专业必修课程综合素质应用能力实践能力高等学校高等教育创新精神条件培养高教

“线上”“线下”混合式“金课”教学模式的探索r——以“语文教学设计与技能训练”课程为例

以自建的浙江省精品课程“语文教学设计与技能训练”为例,从理论和实践两方面入手,将线上资源(慕课视频、网络平台、智能工具)和线下课堂(包括微格教室等)有机结合起来,按照

期刊

金课线上线下混合式教学模式

关于广播电视大学系统学科建设的构想

一、学科建设的意义　　　　1.学科的概念　　学科的概念有原始意义和派生意义。原始意义的学科是指相对独立的知识体系，是一定科学领域的知识门类。当科学发展到某一阶段，人们会把某些具有内在联系的、相关的事物或现象归结在一起，形成一个信息群，构成一个统一的课题或领域，把这一特定的领域作为科学研究的对象，这时就形成了学科。因此，我们说学科是相对独立的知识体系，它的基本特征是学术性、系统性和内在逻辑性。在现实

期刊

广播电视大学系统学科建设知识体系原始意义相对独立科学研究内在逻辑性知识门类人才培养派生意义内在联系科学领域科学发展基本特征管理人员

谈我国高校文科及思想政治理论课的实践教育教学问题

实践教育，是指围绕教育教学活动的目的而开展的、学生亲身体验的实践活动。它既包括为认识、探索自然规律、掌握技术知识而开展的科学实验、生产实习等必要的验证性实验，也包括为解决实际的生产和社会问题，提高创新能力而开展的研究性、探索性、设计性、综合性实践，还包括以了解社会和国情、提高全面素质为宗旨的社会实践。从国内外教育发展走势来看，实践教育教学将成为衡量教育尤其是高等教育质量的重要标准。　　　　一、国外

期刊

高校文科思想政治理论课实践教育教育教学活动社会问题高等教育质量综合性实践验证性实验自然规律实践活动生产实习社会实践全面素质亲身体验科

改革农业院校化学课教学,培养应用型人才

高等农业院校是培养农业人才的摇篮。当今要求农业人才除了掌握系统的专业理论知识外，还须有过硬的专业技能，真正成为农业技术与生产工作的组织者和实干家，所以农业院校中应用型人才的培养越来越得到重视。大学化学作为基础课程既能使学生掌握理论知识，又能培养其动手解决实际问题的能力，为各个学科应用型人才的培养奠定基础。针对应用型人才的培养，我们对大学化学的教学也做了相应的改革，主要从理论课教学内容、教学方法、实

期刊

高等农业院校化学课教学人才的培养应用型农业人才专业理论知识大学化学师资队伍建设考核评价体系解决实际问题课教学内容专业技能实验教学农业技

法学教育改革与“四位一体”实践性教学互动机制

一、我国普通高校法学教育的现状　　　　当前，我国普通高校法学教育沿袭了从一般到特殊的三段论的演绎推理的教育方式，以教师为中心的讲座式教学模式，注重概念、法律规则、法律原则和原理的讲授，缺乏对学生的律师技巧、实际操作能力、综合能力、思维与口才等方面的训练。随着社会生活对法律需求的不断增加和我国法治的不断完善，以及中国入世带来的外来法律文化冲击，人们发现单调刻板的理论框架和学院式教学方法日益不能满足丰

期刊

法学教育改革四位一体实践性教学法律原则普通高校以教师为中心实际操作能力综合能力中国入世演绎推理法律需求文化冲击社会生活理论框架教育方

多重ANN/HMM混合模型的竞争学习机制研究

与本文相关的学术论文