基于混合HMM-ANN模型的汉语连续语音识别技术

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:whicky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该以混合HMM-ANN声学模型研究中存在的基本问题和系统技术为研究内容,主要的创新工作包括:1.大规模神经网络的优化设计和训练算法:神经网络的后验概率估计性能直接影响了混合声学模型的建模精度,并且向所有HMM状态提供观测概率的网络规模很大,用现有标准的误差反向传播(BP)算法很难对它进行有效的训练,网络结构的确定目前还被认为是一件艺术工作.2.后验分布共享的混合声学模型:首先他们强调了语音声学建模是一个静态映射问题,提出了不同层面的语音学单元区分性的层次结构,并从理论上分析了HMM单元在语音特征向量空间中存在大量重叠分布的原因.3.语境相关的混合声学模型:他们首先将关于语境相关混合HMM-ANN建模的研究工作总结为4种形式,指出了后验概率分解和网络隐参数共享是语境相关混合模型的要点.4.融合基元混淆结构的混合HMM-HMM模型.该文最重要的研究成果就是提出并实现了根据基元之间的混淆结构进行有专门区分(也就是基元识别)的想法,并提出了声学识别混淆结构的提取算法和观测概率计算的层次网络结构,这些内容为语音识别的研究开创了一个崭新和富有发展潜力的思路.
其他文献
自从石墨烯被发现以来,二维材料的家族已经迅速地扩张。二维材料具有很多新奇的性质,比如石墨烯独特的光学和电学性质,过渡金属硫族化合物的谷偏振现象和增强的激子效应以及黑磷
作为飞行体重要组成部分之一的天线,其雷达散射截面(RCS)的降低将为飞飞行体整体RCS的降低产生重要的影响.但是,天线不同于一般的散射体,降低RCS不能以牺牲天线的性能为代价.
LHC上Higgs粒子的发现,使得标准模型理论更加完善。但是仍然有很多问题标准模型无法完美的解决,同时当前的实验数据及理论限制并没有严格的限定Higgs理论部分是最小的,即仅含有
论文以块体ZnO、掺杂Ba原子(Zn1-xBaxO)、纳米结构ZnO(薄膜、纳米线、纳米管)材料为研究对象,采用第一性原理计算对其电子结构和光学特性进行了系统的研究。  块体ZnO和ZnO掺杂B
自然界中存在四种基本相互作用,即引力相互作用、电磁相互作用、强相互作用和弱相互作用,其中强相互作用是核子间重要的相互作用之一。1935年,汤川秀树提出了核力的介子场论,1947
单分子磁体(Single Molecule Magnets)是一类磁性大分子,在低温下表现出慢磁弛豫行为,呈现和块体磁性材料相似的性质,能够保持磁化状态达数年之久,为高密度磁存储材料和量子计算
在该文中,作者首先概述了有关多巴胺受体的生理功能和药理学性质、多巴胺受体与大肪功能活动的作用机制以及与一些因大脑神经功能失调导致的神经疾病之间的关系.在此基础上作
该文在对AVSR的研究现状进行了深入的分析以后,集中介绍了对AVSR的一些关键技术的研究:汉语双模态数据库CAVSR1.0的建设、二维视觉特征提取技术研究平台以及三维立体视觉匹配
光纤激光器在光通信、光传感、非线性光学、激光加工、国防等领域有着重要的应用,因此受到广泛的研究。其中,被动锁模光纤激光器由于能产生超短脉冲,且具有结构简单、体积小、重