汉语非特定人连续数码串语音识别系统的研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:qinggo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术经过30多年的发展,目前的研究已经进入非特定人、大词汇量、连续语音识别的高级阶段。在这个过程中,隐马尔可夫模型(HMM)扮演了重要的角色,当前几乎所有优秀的语音识别系统都是基于HMM的。但是,传统的连续密度隐马尔可夫模型(CDHMM)有状态输出独立的假设,并假定其状态输出概率密度函数为混合高斯分布函数线性加权和。   针对这些问题,本文提出了一种新结构的识别模型——CDHMM/MLP混合网络模型,即将传统的HMM和多层感知器(MLP)网相结合,以HMM为基本框架,每个HMM状态对应于一个MLP网,用相继的若干帧特征矢量作为MLP网的输入,利用改进的BP算法,对系统的输出进行预测,从而实现对每个状态的输出概率密度函数的估计,这样识别系统的状态输出概率取决于MLP网对实际语音信号的逼近程度。该方法不仅能有效地在语音识别中引入帧间相关性,而且能克服状态输出概率密度函数为混合高斯分布的束缚,很好地描述了语音信号中存在的非线性特性。本论文为基于基本的HMM和基于混合网络模型这两种不同算法分别建立了非特定人汉语连续数码串语音识别系统,通过对比分析这两个系统的实验结果发现后者的识别效果明显优于前者,充分证实了该方法的有效性。   本论文首先介绍了语音识别的发展、现状、方向和应用前景,接着重点介绍了目前应用最广泛的MFCC特征参数的提取过程。其次,从评估问题、训练问题、解码问题三个方面对HMM进行了详细的介绍。再次,对神经网络及其在语音识别中的应用做了介绍,并对本文中选用的MLP网进行了详细的探讨。最后应用这两种不同的模型借助MATLAB平台分别建立了汉语非特定人连续数码串语音识别系统,并对这两个识别系统的实验结果进行了对比、分析,证实了基于混合网络模型的系统识别效果要优于基本模型的,同时对本论文的工作做了总结,对今后进一步的研究做了展望。   
其他文献
几个世纪以来,天然产物尤其是药用植物成分是人类获得药物的重要来源。在发展中国家,植物一直是药物的主要来源,世界上有80%的人口主要依赖于植物和植物提取成分来维护健康。植物的生物活性成分研究是开发药物或药物先导化合物的第一步,有些活性成分甚至能直接被开发为药物或保健品,如紫杉醇(taxol)、白藜芦醇(resveratrol)等。白藜芦醇低聚体及其衍生物因具有抗菌、抗氧化、抗HIV和抗肿瘤等多种生物
云南白药股份有限公司是中成药行业一家优质上市公司,依靠企业的国家保密配方,它在云南省具有着极高产品知名度和市场份额.本论文通过使用趋势分析法来评估企业的盈利能力、
为进一步发展农产品冷链运输,提高广西农产品市场占有率,在考察广西冷链物流现象的基础上,以区位优势为支点,试图架构“大湾区+新通道”冷链物流运输体系,实现广西冷链运输通
类金融模式作为一种全新的商业管理模式,当前在国内多个行业当中得到广泛的应用,为企业的供应链和资金管理工作,提供全新的改革优化路径.在基于供应链类金融模式之下,根据企
周围神经是连接中枢神经系统和外周靶组织器官信号通路的中转站。周围神经损伤,又是一类在临床上极其常见的症状。当其损伤后,中枢神经系统和靶组织器官的联络在一定程度上被中
卫星光通信以激光作为信息的载体在卫星间和卫星与地面间建立高速、迅捷的信息通道,是光通信技术在卫星应用领域的拓展,也是现代卫星通信领域的重要研究方向。随着卫星平台技术
民以食为天,消费者总是频繁地作出食品决择,而选择标准也随着时代的变迁产生着变化.如今许多研究者就“消费者对健康食品选择的影响因素”这一命题展开探索.本文整理了国内外
栽培植物的野生近缘种和野生型是育种的宝贵资源,同时,栽培起源也是当今研究的热点问题之一。野生茶树是商品茶育种的珍贵种质,有着重要的经济价值,然而近年来在市场利益的驱
本文首次成功地采用双加热器混合物理化学气相沉积MgB2超导薄膜,因为B2H6的分解温度(460℃~600℃)、Mg源的熔融温度(648℃)、以及Mg蒸气与B蒸气的反应生成MgB2的温度不同;采用双
电阻抗成像技术(ElectricalImpedanceTomography,EIT)是当今生物医学工程的重大研究课题之一。它根据人体内不同组织具有不同的电阻抗这一物理原理,通过给人体注入小的安全电流