语音识别及其相关研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:dddff628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该报告的主要工作就是围绕语音识别的一些基本技术展开的,主要包括以下几个方面:最小分类误差训练:我们采用基于最小分类误差准则的模型训练方法,直接将模型的性能(识别率)与模型的训练过程联系在一起,而且能够根据模型之间的辨别信息调整模型的参数,从而在整体上使模型达到最优.我们基于这种思想对声学模型进行最小分类误差训练,显著地提高了模型的分类性能.二次搜索识别器:连续语音识别在众多领域有着广泛的应用.但是在许多应用中,由于硬件资源的限制,对语音识别系统提出了更苛刻的要求,即利用尽可能少的资源,以尽可能快的速度、尽可能高地识别精度完成识别任务.为了满足这一需求,我们充分利用了单因子模型和三因子模型的特点,构造了一种基于二次搜索策略的语音识别器,可以在保证识别精度的同时提高识别的速度.声学模型的训练和细化:在实验中,我们采用了逐步细化的策略训练声学模型.为了解决在训练三因子模型过程中遇到的训练数据不足的问题,我们还利用了基于决策树的模型捆绑技术,从而大幅度地压缩三因子模型中的独立状态的个数.提琴音乐分析:提琴音质的客观评测标准一直是提琴制作大师们梦寐以求的目标.建立这种客观评测标准的前提是对乐音的分析技术.我们利用语音识别技术对不同提琴奏出的乐音进行识别,得到非常好的结果.听觉特性:我们在参数提取过程加入了几种众所周知的人耳听觉特性,得到的特征参数具有与广泛采用的MFCC参数类似的性能.多发音字典:为了考虑发音变化带来的影响,我们在发音字典中引入多个发音,并且根据不同发音的出现频数,为每个发音定义了发音概率.通过实验证实,多发音字典可以有效地提高系统的识别率.
其他文献
掺饵光纤环腔激光器的稳态特性和输出波长的温度调谐是该论文的工作重点.利用现有设备,测量了掺饵光纤的自发辐射谱,研究了掺饵光纤增益随泵浦强度的变化,研制出了掺饵光纤环
碳是周期表中最重要的元素之一,按照碳与碳之间不同的键合方式,它可以组成无数种形态各异、性能优异的材料,正是由于其独特的结构和性能,碳科学研究一直都被认为是相当重要的
地层特性通常有很强的方位性,必须进行三维测量才能提供完整的地层信息,就需要测井仪器能够在径向以及周向上均具有分辨能力。随着油气开发需求的增长,需要对井周围数米到数十米
该文结合多通道量子亏损理论和多重散射自洽场方法,计算SiH分子Si原子2p内壳层电子的振动分辨的X光近阈精细结构.
准一维纳米材料是当今纳米材料科学领域的前沿和热点,因为准一维纳米材料的成功制备为人们进一步认识纳米效应、建立纳米体系的知识框架奠定基础;同时由于准一维纳米材料具有
20世纪80年代末诞生并发展起来的纳米科学技术有可能成为21世纪的主导技术。纳米材料具有许多传统材料无法媲美的奇异特性和特殊功能,在各行各业中将有空前的应用前景。氧化锆作为陶瓷材料的一种,其特殊的发光机制及在不同波长激光光束照射下发生的亲水性亲油性的转化特性,近年来吸引了众多研究者的兴趣。氧化锆(ZrO_2)纳米微粒由于其特殊的光电特性和潜在的应用前景吸引着更多的关注。这些应用前景如光学器件的制造
在所有的复杂系统中,人的大脑是宇宙中已知的最复杂的、多相的,而且高度有序的奇妙的系统.若干个世纪以来,许多思想家和科学家一直在试图理解人的精神或人脑是如何工作的.该
该文对任意面形、任意入射条件、任意光轴取向的一维各向异性周期光栅的衍射作了严格模式理论分析,并采用傅立叶因式分解和反射透射系数阵递推算法以提高数值计算的稳定性和
水下目标探测一直是水声界的一个重要研究课题.长期以来,人们研究出了各种各样的探测技术,声纳岸站便是其中一种.该文根据中国几个重要港口附近的水文环境数据,模拟计算出当
该文介绍了北京谱议主漂移室Ⅲ(MDCⅢ)的结构设计、建造过程、丝的张力测量及其数据处理、丝的高压漏电流测量、宇宙线信号测试等.从机械性能指标来看,MDCⅢ达到了设计目标.从