【摘 要】
:
语音识别是一门内涵丰富、应用广泛的技术,在一些应用领域中正迅速成为一个关键的具有竞争力的技术,如用于自动口语翻译,实现跨语言交流。本文以汉语大词表连续语音识别为应用背
论文部分内容阅读
语音识别是一门内涵丰富、应用广泛的技术,在一些应用领域中正迅速成为一个关键的具有竞争力的技术,如用于自动口语翻译,实现跨语言交流。本文以汉语大词表连续语音识别为应用背景,主要研究了基于人工神经网络模型(ANN)与隐马尔可夫模型(HMM)相结合的混合模型。本文详细分析了ANN和HMM的优点与缺点。深入研究了五种主要的ANN/HMM混合模型:早期模拟HMM算法的尝试;用ANN估计HMM的状态后验概率;基于全局最优训练方法的混合模型;ANN作为离散型HMM的矢量量化器;ANN作为HMM的后处理器。本文研究了ANN/HMM混合模型的优势,并提出了一种基于隐马尔可夫模型和人工神经网络混合模型的汉语大词表连续语音识别系统。在混合模型系统中,多种模型协同工作。ANN是状态级模型,负责建模音素发音物理特性;HMM联合语言学模型识别待识语料。这样,混合模型系统能够结合HMM和ANN两种模型的优点:HMM对时间序列结构建模能力强;ANN的非线性预测能力强,建模能力强,鲁棒性,便于硬件实现。最后,考虑到音节发音的发音变化性和神经网络的结构特点,将多路径建模技术引进系统,明显减少了删除错误,增强了系统的建模能力。实验结果表明,HMM/ANN混合模型系统有效结合了两种模型的优点,提高了识别率。
其他文献
图编程方式是软件开发模式的一种新方法,能充分体现软件复用技术,具有开发效率高、专业要求低、代码质量高等优点,可被广泛应用到各个领域,是未来软件发展的方向。目前,图编
传统的PLC(可编程序控制器)多以实现逻辑控制为主,但对于复杂的过程控制无能为力,并且实现起来比较繁琐。PLC不适合用于过程控制的主要阻碍因素是模拟量编程过于复杂。现代工业
随着互联网的急速发展和关系数据库的广泛应用,人们越来越认识到如果能将信息检索技术和数据库技术结合起来,将会带来更好的用户体验。本文在基于模式图的数据库关键字检索的
为了实现汽油机燃油喷射和点火的精确控制、达到节能减排、优化发动机整体性能的目的,论文对eTPU(enhanced Time Processing Unit)在汽油机ECU中的应用进行了深入详细的研究。
代数方法的动态门结构表示法,可通过将复杂子树中的 FDEP门转换为基本事件的割集给出子树的解。 航天复杂系统中共因事件和输入次序交互等动态事件给可靠性研究带来了挑战
在信息大爆炸的时代,分布式系统是现今计算科学的主要研究重点之一。随着用户及信息数据的爆炸式增长,系统在发生着剧烈的变化,新的问题也显现出来。各节点各自的行为、链路失效
Web系统传输性能是B/S结构应用系统开发过程中不可忽视问题,近年来,随着互联网的快速发展,尤其是无线通信技术的迅速发展,网络接入技术变得多样化,人们对通过互联网访问Web系
字符串匹配一直都是计算机科学的研究热点和难点。在信息安全领域中,关键字规模变大、互联网流量的增加,使得字符串匹配算法成为网络安全系统的性能瓶颈。本论文首先综述了三种
随着国民经济的持续发展,城市车辆饱有量越来越高,随之而来的交通拥堵问题也成为影响我们日常工作与生活的重要因素之一,寻找最优的交通解决方案成为人们关注的焦点。从研究所花
定性概率网是贝叶斯网络的一种定性抽象方式,表达的是节点之间的单调影响,即变量间增减的趋势,具有高效的推理机制。然而,有时我们并不关心定性概率网所表达的节点后验概率之