基于分段模型的帧间相关性建模研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:gbqangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学模型的研究对提高语音识别系统性能有着重要作用。隐马尔可夫模型(HMM)是目前国内外普遍使用的方法。HMM的一个基本假设是各观测矢量间独立同分布,这一假设没有考虑相邻帧特征矢量间的相关性信息。于是,如何充分利用特征矢量间的相关性信息,以得到更精确的数学模型,就成了众多学者努力的目标。本文在随机分段模型的框架之下,对语音识别中的帧间相关性建模方法进行了深入的研究。主要工作包括:(1) 分析了随机分段模型的建模思想,重点研究了基于分段的线性动态系统声学模型。随机分段模型在建模阶段能够充分利用特征之间的动态特性,其对语音信号的数学描述比起HMM来也更显精确。另外,通过大量的实验研究发现,语音帧间的依赖关系可以用线性模型来描述。基于这两方面考虑,线性动态系统分段声学模型可以更好地描述语音信号。(2) 实现了线性系统辨识EM算法,提出了一种基于统计分析的算法初始化方法。EM算法是一种很有效的最大似然估计方法。但是,它最大的不足就是收敛速度太慢。加快收敛速度的最直接的方法就是解决算法的初值问题。本文提出的算法初始化方法加快了算法收敛速度,且能保证算法数值稳定。(3) 提出了在分段时间归整后再进行轨迹平滑和根据上下文信息用多个模型为一个音节建模两个思想。轨迹平滑体现了线性动态系统的轨迹建模思想。通过考虑音节的上下文信息可以为音节建立更精确的数学模型。实验结果表明,将这两种思想在系统中实现,都可以使识别率有所提高
其他文献
在这篇文章中,我们用Abbes和Saito的分歧理论研究离散赋值环上概型的(l)-进层的临近闭链。  论文的第一部分中,我们给出Deligne-Kato公式的一个新证明。Deligne-Kato公式是计
音乐学科与其他学科相比有它独特的魅力,它以优美的音色、明快的节奏、动听的旋律、丰富的和声构成美的形象,创设意境的和谐,激发人们的情感,让人们去感知、体验、参与,从而
生物是一门与人类的认识和实践息息相关的学科,与人的生活密切相连。高中生物新课程标准特别强调要重视教材与实践相联系,重视学生在现实生活实践中去进行生物课的学习。可见
江苏纸浆电子交易中心2011-12-23报道:机械浆11月总到货量109,1412吨,10月总到货量91,482吨。与上月相比机械浆进口量增加了19.3%,具体数量比较见下表。机械浆11、10年11月进
该文由三章组成.第一章简单介绍了非线性最优化问题以及LC优化问题的产生与发展,并给出了LC优化问题的最优性条件.第二章讨论了LC无约束优化问题.给出了一个新的信赖域算法,
张润世,1964年出生于山西太原,1992年毕业于中央美术学院版画系,是当代著名的油画家、文学插图、素描家、铜版画家。现任中国美术家协会会员,法国独立沙龙协会会员,中国版画
每个学生都是不相同的个体,一千个读者就有一千个哈姆雷特。我们教师不应用“唯我独尊”的威严压抑学生的学习积极性、主动性。而应创造一个能让学生畅所欲言、各抒己见的宽
人工神经网络发展到今天,已有五十多年的历史,在一代又一代学者的不懈努力下,不但理论基础逐渐充实、成熟,而且在信号处理、计算机视觉、模式识别、专家系统、工业控制与气象预测
中国书法向有碑帖之争,或以为,北碑厚重,险峻、磅礴,追求的是一个“势”字;南帖空灵,艳丽、飘逸,讲究的是一个“韵”味;北人铁骨,故碑苍,南人柔韧,故帖秀,今人习书,尝起于碑
树是图论中的一个基本概念,Beineke与Pippert在[2]中首先将其推广到高维空间,后来Dewdney在[1]中又进一步把它推广到n维复形上,得到了(m,n)-树的定义,并且类似于图论中树的特