基于时间序列分析的声母平稳性和参数的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:buxingzhe3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在汉语语音识别的问题上,传统的方法是使用短时平稳线性预测方法来获得用于识别的参数。然而汉语语音的声母部分通常表现出不平稳的性质,不满足短时线性预测所需的假定。用平稳的随机模型对不平稳的信号进行模拟分析,难以达到预期的效果。另一方面,大量的特征参数和高维的特征空间也增加了计算的复杂度。如何选取新的语音信号的识别特征参数,是汉语语音识别的一个重要研究方向。本论文对于语音信号的平稳性分析、度量、模型建立以及参数提取等方面进行了较为系统的探索与尝试。首先,视语音信号为时间序列,对18个有代表性的汉语语音声母进行了平稳性分析,利用单位根检验的方法找到了能够描述声母信号平稳程度的度量;其次,以平稳性度量为基础,对18个声母进行分类,对平稳性性质不同的声母,采用不同的模型进行分析,并提取语音识别参数。对于平稳性较好的声母,尝试使用不同的自回归移动平均模型参数进行识别。经实验,表现最佳的两组新参数与传统的16阶LPC参数相比,平均正识率提高了12%以上,且参数数目仅为传统方法的1/2或1/4。对于平稳性较差的声母,尝试使用条件异方差模型参数进行识别,并加入平稳性参数。经实验,加入平稳性参数的8阶LPC系数识别效果接近于16阶LPC系数;改进后的条件异方差系数识别效果优于8阶LPC参数,且参数数目仅为后者的1/4。上述实验结果表明:从平稳性出发寻找新模型和识别参数的思路是可行的;对不同声母组采用不同识别模型,有利于改进识别效果。另外,计量经济学中用于时间序列分析的一些模型如条件异方差模型等,在语音识别中也值得借鉴。
其他文献
目的评估正常卵巢动态增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging, DCE-MRI)检查的可行性,观察不同月经周期正常卵巢3.0TDCE-MRI参数及时间-信号
普通话水平测试(PSC)是我国目前唯一由中央政府职能部门制定标准,各地政府组织实施的,面向全国各地各种人群的普通话能力测试。它测查应试人的普通话规范程度、熟练程度,认定
现代港口是一个国家或地区有效参与经济全球化并在全球经济竞争中保持主导作用的重要基础设施,港口群的发展与国家重大经济战略有密切的联系,合理布局长三角港口群,提升其综
在古汉语研究中,专书研究是一项不可缺少的基础工作。一直以来,词汇研究都在专书和专题研究中占有重要的地位。要研究某类词,就常常涉及其上一级语法单位——词组。本文是对
临湘由于其地理位置的特殊性,方言比较复杂。但临湘市的方言一直以来都没有受到过学术界的重视,现有文献对临湘方言的研究不是很多,更缺乏专门性质的研究著作,除了当地市志的
本文采用法律语篇信息结构理论,从信息流动的角度对中国刑事庭审问答中的过程控制进行研究,旨在发现过程控制的语言实现形式和机制,并揭示过程控制对语篇信息的影响以及对庭
本文旨在通过对翻译家程镇球关于政治翻译理论的梳理,从文化、语言及文体风格三个角度理解政治翻译中的"忠实"原则,以期纠正将政治翻译中的"忠实"简单等同于"直译"的错误看法
天然气的开发规模随着经济的发展以及科学技术的不断进步得到了很好的发展,天然气借助长输天然气管道被输送到了千家万户,从而大大提升了人们的生活质量以及生活水平。但是,
“动结式”也称“述结式”,它是指由动词带表示结果的补语所组成的句法结构。含有动结式的句子S指示致使情境,包含两个命题,即P1和P2。本文以格语法和管约论为指导,主要研究
本文以四川信息职业技术学院为例,主要从人才培养目标、岗位能力定位、课程体系、实训条件、师资等方面探索适合学生个体的培养模式,确保学生所学知识的内容、专业技能与市场